<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1657-9267</journal-id>
<journal-title><![CDATA[Universitas Psychologica]]></journal-title>
<abbrev-journal-title><![CDATA[Univ. Psychol.]]></abbrev-journal-title>
<issn>1657-9267</issn>
<publisher>
<publisher-name><![CDATA[Pontificia Universidad Javeriana]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1657-92672011000100019</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Evaluación de la confiabilidad del Sistema Cualitativo de Calificación para la versión modificada del Test Gestáltico de Bender]]></article-title>
<article-title xml:lang="en"><![CDATA[Assessment of the Reliability in Two Age Groups Using the Qualitative Scoring System for the Modified Bender Gestalt Test]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[MERINO SOTO]]></surname>
<given-names><![CDATA[CÉSAR]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[BENITES MORALES]]></surname>
<given-names><![CDATA[LUIS]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de San Martín de Porres Escuela Profesional de Psicología ]]></institution>
<addr-line><![CDATA[Lima ]]></addr-line>
<country>Perú</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>01</month>
<year>2011</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>01</month>
<year>2011</year>
</pub-date>
<volume>10</volume>
<numero>1</numero>
<fpage>231</fpage>
<lpage>243</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S1657-92672011000100019&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S1657-92672011000100019&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S1657-92672011000100019&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[El presente estudio tiene por objetivo obtener evidencias de confiabilidad por consistencia interna e intercalificadores para el Sistema Cualitativo de Calificación (Brannigan & Brunner, 2002) aplicado al Test Gestáltico de Bender-Modificado. Los participantes fueron 86 niños, divididos en dos grupos de edad preescolar y escolar. Tres estudiantes de pregrado calificaron los diseños de ambos grupos de niños. Los resultados señalan buenos niveles de confiabilidad intercalificadores y de consistencia interna en el grupo de preescolares, mientras que estos niveles fueron más bajos en el grupo de escolares. Estas diferencias establecen la relación entre estos dos aspectos del error de medición, en los puntajes de esta nueva versión de Test de Bender, y el énfasis en un adecuado entrenamiento de medidas que requieren el juicio del examinador. Se discuten los resultados considerando la potencial utilidad de esta relativa nueva versión del Test Gestáltico de Bender para la práctica clínica y de investigación.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This study is looking for evidences of reliability, for the Qualification Qualitative System (Brannigan y Brunner, 2002) applied to the Bender Gestalt Test-Modified. The participants were 86 children, divided in two groups: pre-school and school; and three students who scored the designs in both groups. The analysis was done in the final grade and the item. The results pointed to the good levels of results of external reliability and internal consistence in the pre-school group, while these levels were scored in the school group. These differences establish the relation between these two aspects of measurement error and the emphasis in an appropriate training of measurements that require the examiner's judgments. We discussed our results considering the potential utility of this relative version of the Bender Gestalt Test for the clinical practice and investigation as well.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Confiabilidad]]></kwd>
<kwd lng="es"><![CDATA[evaluación]]></kwd>
<kwd lng="es"><![CDATA[visomotor]]></kwd>
<kwd lng="es"><![CDATA[test Gestáltico de Bender]]></kwd>
<kwd lng="es"><![CDATA[psicometría]]></kwd>
<kwd lng="es"><![CDATA[Psicometría]]></kwd>
<kwd lng="es"><![CDATA[Prueba Gestalt]]></kwd>
<kwd lng="es"><![CDATA[reproducibilidad de resultados]]></kwd>
<kwd lng="en"><![CDATA[Reliability]]></kwd>
<kwd lng="en"><![CDATA[assessment]]></kwd>
<kwd lng="en"><![CDATA[visualmotor]]></kwd>
<kwd lng="en"><![CDATA[Bender Gestaltic Test]]></kwd>
<kwd lng="en"><![CDATA[psychometry]]></kwd>
<kwd lng="en"><![CDATA[Psychometrics]]></kwd>
<kwd lng="en"><![CDATA[Bender Gestalt Test]]></kwd>
<kwd lng="en"><![CDATA[reproducibility of results]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ 
<font face="verdana" size="2">
    <p align="center"><font size="4"><b>Evaluaci&oacute;n de la confiabilidad del Sistema Cualitativo de Calificaci&oacute;n para la versi&oacute;n modificada del Test Gest&aacute;ltico de Bender   <sup>*</sup></b></font></p>
    <p align="center"><font size="3"><b>Assessment of the Reliability in Two Age Groups Using the Qualitative Scoring System for the Modified Bender Gestalt Test</b></font></p>
    <p><b>C&Eacute;SAR MERINO SOTO <sup>**</sup></b></p>
    <p><b>LUIS BENITES MORALES</b></p>
    <p><sup>*</sup>    Art&iacute;culo de investigaci&oacute;n.</p>
    <p><sup>** </sup>Universidad de San Mart&iacute;n de Porres, Escuela Profesional de Psicolog&iacute;a; Av. Tom&aacute;s Marsano 242, Lima 34, Per&uacute;. E-mails: <a href="mailto:cmerino@usmp.edu.pe ">cmerino@usmp.edu.pe</a> ; <a href="mailto:lbenites1@usmp.edu.pe">lbenites1@usmp.edu.pe</a>
</p>    <p>Recibido: marzo 13 de 2009       Revisado: septiembre 3 de 2009       Aceptado: marzo 29 de 2010 </p>
<hr>
    <p align="center"><b>Para citar este art&iacute;culo</b></p>
    <p> Merino, C., & Benites, L. (2011). Evaluaci&oacute;n de la confiabilidad del Sistema Cualitativo de Calificaci&oacute;n para la versi&oacute;n modificada del Test Gest&aacute;ltico de Bender. Universitas Psychologies 10(1), 231-249.</p>
<hr>
    ]]></body>
<body><![CDATA[<p><b>Resumen</b></p>
    <p>El presente estudio tiene por objetivo obtener evidencias de confiabilidad por consistencia interna e intercalificadores para el Sistema Cualitativo de Calificaci&oacute;n (Brannigan &amp; Brunner, 2002) aplicado al Test Gest&aacute;ltico de Bender-Modificado. Los participantes fueron 86 ni&ntilde;os, divididos en dos grupos de edad preescolar y escolar. Tres estudiantes de pregrado calificaron los dise&ntilde;os de ambos grupos de ni&ntilde;os. Los resultados se&ntilde;alan buenos niveles de confiabilidad intercalificadores y de consistencia interna en el grupo de preescolares, mientras que estos niveles fueron m&aacute;s bajos en el grupo de escolares. Estas diferencias establecen la relaci&oacute;n entre estos dos aspectos del error de medici&oacute;n, en los puntajes de esta nueva versi&oacute;n de Test de Bender, y el &eacute;nfasis en un adecuado entrenamiento de medidas que requieren el juicio del examinador. Se discuten los resultados considerando la potencial utilidad de esta relativa nueva versi&oacute;n del Test Gest&aacute;ltico de Bender para la pr&aacute;ctica cl&iacute;nica y de investigaci&oacute;n. </p>
    <p><b>Palabras clave autores</b>: Confiabilidad, evaluaci&oacute;n, visomotor, test Gest&aacute;ltico de Bender, psicometr&iacute;a.</p>
    <p><b>Palabras clave descriptores</b>: Psicometr&iacute;a, Prueba Gestalt, reproducibilidad de resultados.</p>
<hr>
    <p><b>Abstract</b></p>
    <p>This study is looking for evidences of reliability, for the Qualification Qualitative System (Brannigan y Brunner, 2002) applied to the Bender Gestalt Test-Modified. The participants were 86 children, divided in two groups: pre-school and school; and three students who scored the designs in both groups. The analysis was done in the final grade and the item. The results pointed to the good levels of results of external reliability and internal consistence in the pre-school group, while these levels were scored in the school group. These differences establish the relation between these two aspects of measurement error and the emphasis in an appropriate training of measurements that require the examiner's judgments. We discussed our results considering the potential utility of this relative version of the Bender Gestalt Test for the clinical practice and investigation as well. </p>
    <p><b>Key words authors</b>: Reliability, assessment, visualmotor, Bender Gestaltic Test, psychometry.</p>
    <p><b>Key words plus</b>: Psychometrics, Bender Gestalt Test, reproducibility of results.</p>
<hr>
    <p>El Test Gest&aacute;ltico de Bender (TGB) (Bender, 1987) contin&uacute;a siendo, desde hace varias d&eacute;cadas, una de las pruebas m&aacute;s populares y frecuentemente administradas, y su uso ha generado m&aacute;s de 1 000 art&iacute;culos de investigaci&oacute;n (Brannigan &amp; Decker, 2003). Hasta la fecha, se observan muchos sistemas de calificaci&oacute;n, para ni&ntilde;os y adultos, incluyendo las m&aacute;s actuales y psicom&eacute;tricamente robustas, como el nuevo Sistema de Calificaci&oacute;n Global de Brannigan y Decker (2003) y el Sistema de Calificaci&oacute;n Evolutiva de Koppitz-II (Reynolds, 2007). Las diferentes versiones de los sistemas de calificaci&oacute;n se han sometido a evaluaci&oacute;n de su validez de constructo y del impacto del error de medici&oacute;n, particularmente de la variabilidad del calificador. En los estudios publicados sobre la confiabilidad de este instrumento, la informaci&oacute;n sobre el error de medici&oacute;n proveniente de los calificadores se expresa bajo la forma de coeficientes de correlaci&oacute;n Pearson. Por ejemplo, usando uno de los sistemas m&aacute;s populares para el TGB aplicados en ni&ntilde;os, el acuerdo entre calificadores usando el Sistema Evolutivo de Koppitz (1984) llegaron a coeficientes entre 0.92 y 0.95 adultos con retardo mental (Hustak, Dinning &amp; Andert, 1976). Posteriormente, Aylward y Smidth (1986) hallaron que este sistema es comparable a otras medidas de funcionamiento visomotor con respecto al acuerdo intercalificador, pero que la confiabilidad es variable seg&uacute;n el nivel de desempe&ntilde;o del examinado. En ni&ntilde;os, m&aacute;s recientemente Rae y Hyland (2001) reportaron coeficientes Pearson mayores de 0.80 entre los calificadores, usando este sistema. Otro sistema de calificaci&oacute;n, el Sistema Watkins report&oacute; confiabilidades intercalificadores desde 0.80 hasta 0.97 para el puntaje total (Watkins, 1976). Y estudios posteriores con la escala psicopatol&oacute;gica del Sistema Hutt tambi&eacute;n reportaron excelentes niveles de acuerdo intercalificadores sobre los dise&ntilde;os de ni&ntilde;os escolares entre 7 y 10 a&ntilde;os (Rossini, 1993). Otras modificaciones del Bender Gestalt para el despistaje de la disfunci&oacute;n cerebral han reportado tambi&eacute;n niveles elevados (DeCato &amp; Meldrum, 1989). Elevadas confiabilidades interexaminadores tambi&eacute;n se han hallado para el nuevo Bender-II (Brannigan &amp; Decker, 2006), que van desde 0.83 hasta 0.94 (mediana = 0.90) y tambi&eacute;n para el nuevo el Koppitz-II (Reynolds, 2007). Esta breve revisi&oacute;n de los hallazgos sobre el acuerdo entre calificadores sugiere que las diferentes versiones de puntaci&oacute;n del TGB son moderadamente variables, pero en un estrecho rango, y estas variaciones tienden a ubicarse satisfactoriamente dentro del espacio aun considerado como apropiado para uso cl&iacute;nico.</p>
    <p>La estrategia m&aacute;s com&uacute;n es evaluar la confiabilidad intercalificador con un m&iacute;nimo de dos calificadores, aunque otras estrategias tambi&eacute;n se han aplicado en la fase de an&aacute;lisis y en el proceso de calificaci&oacute;n. Por ejemplo, Swensson y Hill (1990) obtuvieron los puntajes de 12 calificadores de variada experiencia profesional cl&iacute;nica, sobre cuatro protocolos, hallando correlaciones estad&iacute;sticamente significativas en los indicadores evolutivos y los emocionales. Un enfoque similar usaron Mors-bach, Priori y Firnell (1975) con menos calificadores, pero a&ntilde;adiendo la exploraci&oacute;n de la confiabilidad test-retest, medio a&ntilde;o despu&eacute;s de la primera aplicaci&oacute;n. Por lo tanto, el n&uacute;mero de calificadores y la evaluaci&oacute;n entre e intracalificadores han sido estrategias usadas en la determinaci&oacute;n del grado de acuerdo.</p>
    ]]></body>
<body><![CDATA[<p>Por otro lado, entre los sistemas m&aacute;s usados, el Sistema de Koppitz (1963, 1984) ha permanecido muy popular a trav&eacute;s de los a&ntilde;os y ha generado m&aacute;s de 300 art&iacute;culos publicados (Reynolds, 2007) desde su primera publicaci&oacute;n en los a&ntilde;os 60, pero su eficacia ha sido variable respecto a su validez predictiva. Algunos estudios han reportado que las correlaciones del desempe&ntilde;o en el TGB, usando este sistema con criterios relevantes, han sido de menor magnitud que otros sistemas de calificaci&oacute;n. Johnston y Lanak (1985) hallaron un mejor desempe&ntilde;o de las reglas de identificaci&oacute;n de d&eacute;ficits visomotores en el Sistema Watkins, en ni&ntilde;os referidos a evaluaci&oacute;n neuropsicol&oacute;gica. De manera similar, el Sistema Koppitz tiende a explicar menos varianza respecto a criterios de rendimiento escolar estandarizado que otros sistemas m&aacute;s recientes (Brannigan &amp; Brunner, 1989, 1996, 2004; Chang, 2002; Parsons &amp; Weinberg, 1993). Apuntar el inter&eacute;s hacia nuevos enfoques y con mejor respaldo cient&iacute;fico es necesario para una apropiada pr&aacute;ctica profesional. Pero las pruebas se&ntilde;aladas por diversos autores parecen estar midiendo de la misma manera un atributo, y lo que ocurre es que, aunque est&eacute;n etiquetados igualmente, las pruebas no deben asumirse como sustitutos intercambiables, porque cada uno puede demandar diferente tiempo para calificar los protocolos, un enfoque diferente de abordaje de la calificaci&oacute;n y los niveles de acuerdo intercalificador pueden ser bajos (Preda, 1997). Las consecuencias de todo esto son las divergencias en su validez de constructor, cuando se los usan para evaluar los cambios en programas remediales y para obtener descripciones evolutivas del desarrollo visomotor en general (Palisano &amp; Dichter, 1989).</p>
    <p>Hay numerosa investigaci&oacute;n sobre los correlatos en el desempe&ntilde;o del Test de Bender, espec&iacute;ficamente para el Sistema de Koppitz, pero estos provienen casi totalmente del mundo anglosaj&oacute;n. Por otro lado, una revisi&oacute;n informal de las investigaciones no publicadas a nivel de pregrado y postgrado llevar&iacute;a a resaltar que la evaluaci&oacute;n de las propiedades psicom&eacute;tricas no es uno de sus objetivos principales, si es que acaso se los considera. Por lo tanto, puede ser infrecuente hallar resultados sobre el grado de acuerdo entre calificadores en estas investigaciones no publicadas, a menos que se encuentren bajo una adecuada asesor&iacute;a y protocolo de investigaci&oacute;n. Esto est&aacute; probablemente asociado a los cursos de pregrado de medici&oacute;n y pruebas que a&uacute;n permanecen ense&ntilde;ando instrumentos con normas antiguas o sin un eficiente an&aacute;lisis cr&iacute;tico de sus propiedades psicom&eacute;tricas. Espec&iacute;ficamente sobre el TGB, a&uacute;n con la popularidad que tiene este el Sistema Koppitz para ni&ntilde;os, hay un consistente vac&iacute;o para presentar sus propiedades en t&eacute;rminos de confiabilidad intercalificador en los estudios que lo usan. Sin embargo, ya que los datos que manejan los investigadores generalmente est&aacute;n a nivel del &iacute;tem, hay la posibilidad razonable para hacerlo. Los est&aacute;ndares de informaci&oacute;n psicom&eacute;trica propuestos por la American Educational Research Association (AERA), la American Psychological Association (APA) y el National Council on Measurement in Education (NCME) en 1999, recomiendan que se eval&uacute;e la confiabilidad de las mediciones en cada contexto de evaluaci&oacute;n, y tomar solo como referencia aquellos publicados en los manuales, si las diferencias normativas son verificadas. Junto con esta advertencia, la creciente producci&oacute;n tecnol&oacute;gica en los materiales de evaluaci&oacute;n lleva al usuario a utilizar m&aacute;s que un criterio impresionista para elegir una prueba, sino m&aacute;s bien revisar la informaci&oacute;n psicom&eacute;trica publicada y considerar su grado de antig&uuml;edad.</p>
    <p>En el &aacute;rea de la evaluaci&oacute;n actual de la habilidad visomotora en ni&ntilde;os, uno de los competidores psicom&eacute;tricamente robustos, y a&uacute;n poco conocido, es el Sistema de Calificaci&oacute;n Cualitativa (SCC) de Brannigan y Brunner (1989, 1996, 2002), que se aplica a la versi&oacute;n modificada del TGB. Esta versi&oacute;n fue modificada para ni&ntilde;os menores a 8 a&ntilde;os, bas&aacute;ndose en las sugerencias de la misma Bender sobre la elecci&oacute;n de las l&aacute;minas y el sistema de puntuaci&oacute;n (Brannigan &amp; Brunner, 2002) para la bater&iacute;a de Hirsch (Jansky &amp; de Hirsch, 1972). Estudios con la versi&oacute;n modificada del TGB aplicando el SCC para ni&ntilde;os preescolares y de primaria, indican que los niveles de acuerdo son elevados (Brannigan &amp; Brunner, 2002; Chang, 2001; Fuller &amp; Vance, 1995). Este eval&uacute;a la exactitud de cada reproducci&oacute;n sobre una escala de 6 puntos, y en un rango de 6 a 0. Se dise&ntilde;&oacute; para evaluar la calidad global de las reproducciones de los ni&ntilde;os de 4 a&ntilde;os y 6 meses hasta 8 a&ntilde;os y 5 meses. Este sistema de calificaci&oacute;n usa un enfoque estricto de puntuaci&oacute;n basado en que el dise&ntilde;o reproducido debe ser tan bueno o mejor que el ejemplo dado en el manual, para recibir la puntuaci&oacute;n en el nivel de calidad correspondiente. El sistema se aplica a la versi&oacute;n modificada de la prueba del Bender, que &uacute;nicamente utiliza 6 dise&ntilde;os que son los m&aacute;s apropiados en la predicci&oacute;n del rendimiento escolar en ni&ntilde;os de temprana edad. El eje principal que llama la atenci&oacute;n de este enfoque, es el abordaje gest&aacute;ltico utilizado para evaluar la representaci&oacute;n global de cada dise&ntilde;o copiado por el ni&ntilde;o (Brannigan &amp; Brunner, 2002), y que, por lo tanto, demanda el juicio del examinador para otorgar el puntaje a cada dise&ntilde;o de acuerdo a su semejanza con el dise&ntilde;o. Esta situaci&oacute;n demanda al calificador que no se concentre en los detalles o partes discretas de los dise&ntilde;os reproducidos, sino m&aacute;s bien sobre su impresi&oacute;n respecto al grado de exactitud con el est&iacute;mulo presentado. Este aspecto es esencialmente cualitativo y requiere una observaci&oacute;n de la gestalt, de tal modo que evita un an&aacute;lisis discreto de los errores en las reproducciones, tal como lo induce el Sistema de Koppitz. Este sistema destaca la evaluaci&oacute;n de errores discretos en reproducci&oacute;n de cada una de las 9 l&aacute;minas, pero ha sido criticado por enfatizar la sobresimplificaci&oacute;n y el examen molecular de los errores (Brannigan &amp; Brunner, 2002). Sistemas paralelos se han propuesto (Parsons &amp; Weinberg, 1993; Sugar, 1995) pero no han sido extensamente evaluados psicom&eacute;tricamente y, por lo tanto, han permanecido relativamente en el anonimato, para la comunidad cient&iacute;fica.</p>
    <p>El presente estudio tendr&aacute; como objetivo general evaluar dos fuentes de error de medici&oacute;n: la consistencia interna y el acuerdo intercalificadores (Anastasi &amp; Urbina, 1997). La consistencia interna y el grado de acuerdo se estimar&aacute;n respecto al uso del Sistema de Calificaci&oacute;n Cualitativa, SCC (Brannigan &amp; Brunner, 2002), que se aplica para la versi&oacute;n modificada del Test Gest&aacute;ltico Visomotor de Bender. El segundo objetivo del trabajo ser&aacute; comparar el acuerdo intercalificadores sobre la calificaci&oacute;n de las reproducciones en ni&ntilde;os de dos edades diferentes; de nivel preescolar y nivel primario, provenientes de Lima metropolitana. Este &uacute;ltimo objetivo relaciona el grado de desempe&ntilde;o en el funcionamiento visomotor y el nivel de acuerdo entre calificadores. Este planteamiento emergi&oacute; del trabajo de Aylward y Smidth (1986), quienes hallaron que los desempe&ntilde;os pobres en la reproducci&oacute;n de las figuras del TGB tend&iacute;an a producir menor acuerdo entre calificadores; esta afirmaci&oacute;n es paralela con la efectuada por Reynolds y Hickman (2004) para la nueva versi&oacute;n de la Prueba del Dibujo de la Figura Humana para la estimaci&oacute;n de la inteligencia. Ellos se&ntilde;alaron que los dibujos en ni&ntilde;os de menor edad, tienden a producir mayores discrepancias en el uso de criterios que exigen juicio del examinador; su conjetura no present&oacute; datos emp&iacute;ricos ni antecedentes que lo respalden, pero hall&oacute; que el grado de acuerdo entre examinadores fue similarmente alto (r &gt; 0.85) en la calificaci&oacute;n de dibujos realizados entre ni&ntilde;os y adolescentes.</p>
    <p><b>M&eacute;todo </b></p>
    <p><b><i>Participantes</i></b></p>
    <p>Los participantes son una muestra de 86 ni&ntilde;os(as) que forma parte de un estudio de validaci&oacute;n y normalizaci&oacute;n de una prueba de despistaje para habilidades primer grado desarrollado recientemente (Merino, 2006). Los participantes se dividieron en dos grupos de edad provenientes cada uno de instituciones estatales independientes (4 a 5 kil&oacute;metros alejados entre s&iacute;), pero del mismo sector educativo, en el centro de Lima metropolitana. El nivel 1 estuvo distribuido por 42 preescolares (24 varones, 57.1 %), de 4 y 5 a&ntilde;os (n = 19, 45.2 %) de edad, procedentes de tres Programas No Escolarizados de Educaci&oacute;n Inicial (los PRONOEI); estos programas se orientan a ni&ntilde;os de baja condici&oacute;n socioecon&oacute;mica y son ubicados estrat&eacute;gicamente en cada comunidad. El curr&iacute;culo educativo es el mismo que los centros preescolares escolarizados, pero contienen menos recursos materiales e infraestructurales (Merino, D&iacute;az, Zapata &amp; Benites, 2006). Los ni&ntilde;os fueron seleccionados aleatoria y proporcionalmente desde estos tres PRONOEI.</p>
    <p>El grupo de ni&ntilde;os del nivel 2 estuvo compuesto por 44 escolares, 20 varones (45 %) estudiando en segundo y tercer grado de primaria, en el turno de la ma&ntilde;ana de un colegio p&uacute;blico ubicado en una zona urbana en un distrito al sur de Lima metropolitana; la edad m&iacute;nima fue 6 a&ntilde;os ( <i>n </i>= 4, 9.1 %) y la m&aacute;xima 9 (n = 1, 2.3 %); la mayor parte de este grupo tuvo una edad de 6 a&ntilde;os ( <i>n </i>= 22, 50 %) y 7 a&ntilde;os (n = 17, 38.6 %). Como es usual en los colegios p&uacute;blicos de Per&uacute;, cada sal&oacute;n es unidocente y se maneja alrededor de 30 ni&ntilde;os por aula. Dada la zona de ubicaci&oacute;n del colegio, las familias de los ni&ntilde;os en su mayor&iacute;a alcanzaron el nivel secundario, y las madres tienden a pasar m&aacute;s horas con el ni&ntilde;o que el padre, ya que se ocupan del hogar y eventualmente realizan trabajos independientes; y mayoritariamente, las familias de los ni&ntilde;os conviven con otros familiares. Por otro lado, los calificadores fueron tres estudiantes (mujeres) de mitad de la carrera de Psicolog&iacute;a, en una universidad estatal en Lima; son de asistencia regular y perteneciente el tercio medio en rendimiento acad&eacute;mico. Estos estudiantes no ten&iacute;an experiencia previa en la administraci&oacute;n y calificaci&oacute;n de alguna versi&oacute;n del TGB, pero s&iacute; en instrumentos de desarrollo psicomotor. Se consider&oacute; que la inexperiencia espec&iacute;ficamente en alg&uacute;n sistema de calificaci&oacute;n para el TGB puede ser una condici&oacute;n facilitadora del aprendizaje de este nuevo sistema, pues la nueva informaci&oacute;n no tendr&iacute;a que competir con el aprendizaje previo, que invocar&iacute;a otra manera de abordar la calificaci&oacute;n y asignar los puntajes.</p>
    <p><b><i>Instrumento</i></b></p>
    <p><i>Test Gest&aacute;ltico de Bender Modificado. </i>La versi&oacute;n modificada contiene seis de los dise&ntilde;os originales (A, 1, 2, 4, 6 y 8) para su aplicaci&oacute;n a ni&ntilde;os preescolares hasta los primeros grados del nivel primario (4.5 hasta 8.5 a&ntilde;os), dado que son los m&aacute;s apropiados para ni&ntilde;os peque&ntilde;os. El manual describe un sistema para puntuar el desempe&ntilde;o gr&aacute;fico del ni&ntilde;o, el SCC (Brannigan &amp; Brunner, 2002) de 6 puntos, desde una puntuaci&oacute;n de 0 (l&iacute;neas aleatorias, garabateo, sin concepto del dise&ntilde;o) hasta 5 (representaci&oacute;n exacta del dise&ntilde;o) y que logran gran diferenciaci&oacute;n en la evaluaci&oacute;n de la calidad los dibujos. Esta versi&oacute;n se califica por un m&eacute;todo de inspecci&oacute;n global, que refleja el grado de diferenciaci&oacute;n y de la gestalt de los dise&ntilde;os reproducidos. La investigaci&oacute;n sobre la confiabilidad interna, test-retest e intercalificadores (Fuller &amp; Vance, 1995), y la validez del SCC da soporte a sus propiedades m&eacute;tricas y sus cualidades instrumentales en la evaluaci&oacute;n psicopedag&oacute;gica (Brannigan &amp; Brunner, 2002). El SCC acepta que una de las modalidades de administraci&oacute;n sea la grupal, ya que se hallan solo diferencias peque&ntilde;as entre la administraci&oacute;n individual (Caskey &amp; Larson, 1977, 1980). Frente al Sistema Evolutivo de Calificaci&oacute;n de Koppitz (1983), el SCC muestra correlaciones m&aacute;s elevadas con criterios de rendimiento escolar en el estudio original (Brannigan &amp; Brunner, 2002), as&iacute; como en una muestra culturalmente diferente (en Hong Kong; Chan, 2002). El manual presenta una extensa revisi&oacute;n de los hallazgos psicom&eacute;tricos, as&iacute; como los criterios de calificaci&oacute;n de cada dise&ntilde;o; por ejemplo, los indicadores de consistencia interna y acuerdo interexaminadores son satisfactorios.</p>
    ]]></body>
<body><![CDATA[<p><b><i>Procedimiento</i></b></p>
    <p>El dise&ntilde;o de la investigaci&oacute;n es post hoc, no experimental, y dentro de un marco cuyo objetivo es psicom&eacute;trico, es decir, orientado hacia el instrumento de medici&oacute;n. Respecto al proceso de recolecci&oacute;n de datos, este tuvo algunas diferencias en los dos grupos de edad. De este modo, a los ni&ntilde;os del nivel 1 se les aplic&oacute; el TGB-modificado en una sesi&oacute;n de evaluaci&oacute;n individual, junto a otras pruebas de desarrollo psicomotor como parte de una bater&iacute;a de evaluaci&oacute;n de control del desarrollo, en que el TGB-modificado se administr&oacute; generalmente al inicio de la sesi&oacute;n de evaluaci&oacute;n. En los ni&ntilde;os del nivel 2, se administr&oacute; el TGB-modificado grupalmente, mediante cuadernillos en que cada figura se presentaba en una p&aacute;gina distinta y en el tercio superior de la hoja orientada verticalmente. Este formato del TGB-modificado tambi&eacute;n se aplic&oacute; en el primer grupo de ni&ntilde;os descrito. Para la administraci&oacute;n en ambos grupos, se siguieron las reglas de aplicaci&oacute;n estandarizada respecto al ambiente, relaci&oacute;n con el ni&ntilde;o e instrucciones generales de aplicaci&oacute;n.</p>
    <p>Por otro lado, en el proceso de calificaci&oacute;n de los protocolos, tres estudiantes sirvieron como calificadores de los protocolos aplicados, en cada grupo de ni&ntilde;os del nivel 1 y del nivel 2, pero que no participaron en la aplicaci&oacute;n de las pruebas. El autor del presente estudio, con experiencia en evaluaci&oacute;n psicol&oacute;gica a nivel profesional y de investigaci&oacute;n, monitore&oacute; el progreso de la administraci&oacute;n, el entrenamiento en la calificaci&oacute;n y el acuerdo entre los calificadores antes y despu&eacute;s de concluido el estudio.</p>
    <p>En el protocolo de entrenamiento la primera sesi&oacute;n sirvi&oacute; para exponer el marco conceptual del SCC (Brannigan &amp; Bruner, 2002) compar&aacute;ndolo con el Sistema Evolutivo de Koppitz (1984).</p>
    <p>Seguidamente, se explic&oacute; el nivel de puntuaci&oacute;n general y los criterios espec&iacute;ficos para algunas de las l&aacute;minas. En la segunda sesi&oacute;n, se pas&oacute; a calificar monitoreadamente al menos 5 de los ejemplos que aparecen en el manual, as&iacute; como 5 protocolos de reproducciones hechas por ni&ntilde;os; en tal sesi&oacute;n, se discuti&oacute; la forma en que se lleg&oacute; la calificaci&oacute;n y se lleg&oacute; a un acuerdo sobre la puntuaci&oacute;n apropiada a cada uno de los 5 protocolos. En cada sesi&oacute;n de entrenamiento, se enfatiz&oacute; la indicaci&oacute;n clave del manual y del propio autor (G. Brannigan, comunicaci&oacute;n personal, 2006), es decir: &quot;que el dibujo debe ser tan bueno o igual que el que aparece en el manual; en caso de duda, se asignar&iacute;a el puntaje m&aacute;s bajo&quot;. A cada calificadora se le asign&oacute; la tarea de calificar todos los protocolos, y luego pasar los protocolos a otra calificadora; se les instruy&oacute; para leer el manual y seguir estrictamente las indicaciones de calificaci&oacute;n si hubiera dudas, y no consultar con las otras calificadoras.</p>
    <p>Para obtener los resultados estad&iacute;sticos respecto a la consistencia interna, se us&oacute; en coeficiente alfa (Cronbach, 1951), y luego se hicieron comparaciones de estas estimaciones en ambos grupos de edad, usando el programa ALPHATEST (Lautenschlager &amp; Meade, 2008; Merino &amp; Lautenschlager, 2003). Esta comparaci&oacute;n permitir&aacute; revelar si estas estimaciones permanecen estables, cuando el impacto de las diferencias entre los puntajes de lo calificadores y entre ambos grupos de edad son factores causales de posible variaci&oacute;n. Por otro lado, el an&aacute;lisis del acuerdo intercalificadores se condujo en dos niveles de puntajes: el puntaje total y los puntajes en los &iacute;tems. El puntaje total representa el nivel de desempe&ntilde;o en el ni&ntilde;o sobre el atributo medido (integraci&oacute;n visomotora), y su m&eacute;trica se asume en el nivel de intervalo y continuo. Generalmente, los puntajes en el TGB son el objeto del an&aacute;lisis del acuerdo interexaminadores, pero nuestro estudio avanz&oacute; un paso m&aacute;s adelante, como se hizo en Fuller y Vance (1995), ya que evalu&oacute; el grado de acuerdo sobre cada &iacute;tem o l&aacute;mina. El desempe&ntilde;o del ni&ntilde;o en cada l&aacute;mina est&aacute; representado por una puntuaci&oacute;n del 0 al 5 basado en el Sistema de Calificaci&oacute;n Cualitativa de Brannigan y Brunner (1986, 2002); la puntuaci&oacute;n en cada dise&ntilde;o es ordinal, y es una gradiente de exactitud del dise&ntilde;o reproducido.</p>
    <p>El coeficiente utilizado para estimar el acuerdo intercalificadores estuvo en el contexto del modelo de componentes de varianza, usando el an&aacute;lisis de varianza desde el que se deriva el coeficiente de correlaci&oacute;n intraclase (ICC) (Shrout &amp; Fleiss, 1979), que se aplica cuando los datos bajo an&aacute;lisis tienen una m&eacute;trica continua. Se aplicar&aacute; el modelo 2, que asume que los calificadores son seleccionados aleatoriamente de alguna poblaci&oacute;n de calificadores potenciales y cada calificador eval&uacute;a a cada examinado; este es el modelo de efectos aleatorios de dos v&iacute;as y cubre mayormente las situaciones de acuerdo intercalificadores. Se calcular&aacute; el ICC para estimar el acuerdo sobre una sola medici&oacute;n o calificador (ICC &#91;2,1&#93;). Debido que existe una correspondencia conceptual y algebraica entre el estad&iacute;stico Kappa para m&uacute;ltiples calificadores sobre variables ordinales y los coeficientes de correlaci&oacute;n intraclase (Fleiss &amp; Cohen, 1973; Rae, 1988), se aplic&oacute; el ICC tambi&eacute;n a los puntajes individuales (seis l&aacute;minas).</p>
    <p>En la determinaci&oacute;n del grado de acuerdo, los niveles cualitativos de acuerdo recomendados tienden a variar de autor en autor (Charter, 2003); pero se usar&aacute; uno que es posiblemente de los m&aacute;s citados en la literatura: Cicchetti y Sparrow (1981) y Ciccheti (1994) que declaran cuatro niveles de evaluaci&oacute;n cualitativa aplicable al acuerdo intercalificadores: &lt; 0.40 = pobre, 0.40 - 0.59 = aceptable, 0.60 - 0.74 = bueno, &gt; 0.74 = excelente.</p>
    <p>Tambi&eacute;n se informa de la correlaci&oacute;n de Pearson entre los examinadores, pero la interpretaci&oacute;n del grado de acuerdo no se pondera de manera importante con este estad&iacute;stico, ya que este &uacute;nicamente informa de la relaci&oacute;n lineal entre las variables y no considera en su estimaci&oacute;n las diferencias entre los puntajes de los examinadores. Las correlaciones producto-momento, en esencia, son insensibles a la escala usada en los puntajes, pero s&iacute; a la monoticidad de las relaciones (Cone, 1999); por lo tanto, ya que nuestro inter&eacute;s es la variabilidad de la magnitud del acuerdo, la correlaci&oacute;n intraclase ser&aacute; la m&aacute;s apropiada. Los an&aacute;lisis finalizan con la presentaci&oacute;n de resultados descriptivos que representan los primeros datos de tendencia central y variabilidad en participantes hispanos, de este nuevo sistema de calificaci&oacute;n.</p>
    <p><b>Resultados</b></p>
    ]]></body>
<body><![CDATA[<p>Presentamos a continuaci&oacute;n, los an&aacute;lisis de la confiabilidad respecto a la consistencia interna y al acuerdo intercalificadores del Sistema de Calificaci&oacute;n Cualitativo aplicado a la versi&oacute;n modificada del Test Gest&aacute;ltico Visomotor.</p>
    <p><b><i>Confiabilidad</i></b></p>
    <p><i>Consistencia interna. </i>En la <a href="#t1">Tabla 1</a> se muestra que la consistencia interna tendi&oacute; a ser menor en los puntajes de las calificadores en el grupo del nivel de edad 2 (&#935;<sub>&#945;</sub> <sub>Conbach</sub> = 0.55) respecto al otro grupo (&#935;<sub>&#945;</sub> <sub>Conbach </sub>= 0.78). Dentro del nivel de edad 1, la consistencia interna tuvo pocas variaciones, pues la diferencia entre ellas no fue estad&iacute;sticamente significativa,&#935;<sub></sub><sup>2</sup> (2) = 3.07, <i>p </i>= 0.21 ; en cambio, en el grupo de ni&ntilde;os mayores (nivel 2), se detectaron diferencias estad&iacute;sticamente significativas,&#935;<sup>2</sup> (2) = 7.28, <i>p </i>= 0.02. En este grupo, una calificadora C baj&oacute; la consistencia del grupo cuando fue pareada con las dem&aacute;s, y la variabilidad de sus puntajes estuvo relacionada con esta situaci&oacute;n, ya que la desviaci&oacute;n est&aacute;ndar de sus puntuaciones totales fue menor en ambos grupos de edad.
</p>
    <p align="center"><a name="t1"><img src="img/revistas/rups/v10n1/v10n1a19t1.jpg"></a></p>
    <p><i>Acuerdo intercalificadores. </i>Nuestros resultados se&ntilde;alan un acuerdo intercalificadores m&aacute;s elevado en el puntaje total y en cada dise&ntilde;o reproducido (<a href="#t2">Tabla 2</a>) para el nivel de edad 1. Excepto dos l&aacute;minas (dise&ntilde;o 2 y 3), el resto tuvo un patr&oacute;n de acuerdo similar entre los dos niveles de edad; es decir, hubo dise&ntilde;os que aparentemente tienden a generar m&aacute;s acuerdo que otras. Cuantitativamente, el pobre nivel de acuerdo en las l&aacute;minas 2 y 3 tuvo m&aacute;s influencia para explicar el m&aacute;s bajo nivel de acuerdo hallado en el puntaje total de los ni&ntilde;os en el nivel 2; pero los dem&aacute;s &iacute;tems tambi&eacute;n revelaron que el acuerdo en ellos fue sistem&aacute;ticamente menor que en el acuerdo de los ni&ntilde;os del nivel 1. La observaci&oacute;n de la <a href="#t2">Tabla 2</a> hace reconocer que el m&aacute;ximo nivel de acuerdo en el grupo del nivel 2 fue <i>bueno, </i>mientras que en el grupo del nivel 1, se alcanza hasta un nivel de acuerdo <i>excelente. </i>La <a href="#t2">Tabla 2</a> tambi&eacute;n muestra los resultados de aplicar el m&eacute;todo de Alsawalmeh y Feldt (1992) con un programa ad hoc (Merino, en revisi&oacute;n) para comparar correlaciones intraclase de muestras independientes (Merino, 2009). Como se observa, las diferencias estad&iacute;sticamente significativas ocurrieron en la mitad de las primeras l&aacute;minas, as&iacute; como en el puntaje total. Es aparente una secuencia curvil&iacute;nea de diferencias entre las l&aacute;minas.</p>
    <p><b><i>An&aacute;lisis descriptivos</i></b></p>
    <p><i>Normalidad. </i>Las pruebas de normalidad basadas en Komogorov-Smirnov <i>(KS </i>con ajuste Lilliefors; Lilliefors, 1967) y en Shapiro-Wilk (SW, Shapiro &amp; Wilk, 1965) indicaron que no hay alejamientos sustanciales de la distribuci&oacute;n normal te&oacute;rica para el grupo de nivel 1 (KS &lt; 0.11, <i>SW </i>&lt; 0.99) y del nivel 2 (KS &lt; 0.15, <i>SW </i>&lt; 0.97). Esto sugiere que se podr&iacute;an usar los percentiles de esta distribuci&oacute;n te&oacute;rica para describir las posiciones de rendimiento de los ni&ntilde;os evaluados.</p>
    <p align="center"><a name="t2"><img src="img/revistas/rups/v10n1/v10n1a19t2.jpg"></a></p>
    <p><i>Variabilidad y tendencia central. </i>Se observa que la calificadora C tuvo menor variabilidad que los puntajes totales de las otras calificadoras (<a href="#t1">Tabla 1</a>); esta tasa de variabilidad fue de 5 % y 23 % mayor en los niveles de edad 1 y 2, respectivamente. Sin embargo, las diferencias entre las varianzas no fueron estad&iacute;sticamente significativas en el nivel 1 (W <i>Mauchy </i>= 0.93,&#935;<sup>2</sup>(2) = 2.51) y nivel 2 (W <i>Mauchy </i>= 0.91, &#935;<sup></sup><sup>2</sup>(2) = 3.74).</p>
    <p>Respecto a las diferencias en los puntajes promedio, en el nivel de edad 1, &uacute;nicamente las diferencias entre el calificador A y B fueron estad&iacute;sticamente significativas, t(41) = 3.68, <i>p </i>&lt; 0.01; la magnitud del efecto para muestras relacionadas (Lipsey &amp; Wilson, 2000), fue <i>d </i>de Cohen = 0.57. Mientras, en el nivel 2, las diferencias estad&iacute;sticamente significativas surgieron entre los pares de jueces A-C (t&#91;43&#93; = 8.56, <i>p </i>&lt; 0.001, <i>d </i>de Cohen = 1.78) y B- C (t&#91;43&#93; = 6.67, <i>p </i>&lt; 0.001, <i>d </i>de Cohen = 1.01.</p>
    ]]></body>
<body><![CDATA[<p>Las diferencias en los puntajes promedio entre los grupos de edad preescolar y escolar (nivel 1 y 2, respectivamente) fueron esperables debido a la maduraci&oacute;n de sus funciones visomotoras, y que en estas edades tiende a incrementarse aceleradamente (Decker, 2008). Promediando los estad&iacute;sticos descriptivos (media y desviaci&oacute;n est&aacute;ndar de las calificadoras), el grupo de mayor edad super&oacute; el desempe&ntilde;o visomotor m&aacute;s de dos desviaciones est&aacute;ndares <i>(d </i>Cohen = 2.95).</p>
    <p><b>Discusi&oacute;n</b></p>
    <p>La evaluaci&oacute;n de la integraci&oacute;n visomotora continua siendo importante y predictiva (Sattler, 2003; Simner, 1991; Simner &amp; Barnes, 1991) y ser&iacute;a raro que deje de incluirse en bater&iacute;as predictivas para, por ejemplo, el inicio del primer grado (Berdicewski &amp; Milicic, 2004). Por lo tanto, la evaluaci&oacute;n las propiedades psicom&eacute;tricas de recientes propuestas de su medici&oacute;n, espec&iacute;ficamente en el mundo hispano, es necesario para establecer cient&iacute;ficamente su precisi&oacute;n para obtener interpretaciones adecuadas; y este es la situaci&oacute;n del Sistema Cualitativo de Calificaci&oacute;n-SSC, (Brannigan &amp; Brunner, 2002), para la Prueba Gest&aacute;ltica de Bender Modificada. En esta l&iacute;nea, el presente art&iacute;culo examin&oacute; el error de medici&oacute;n mediante una estrategia de estimaci&oacute;n puntual de la consistencia interna y del acuerdo intercalificadores, y de comparaci&oacute;n de estas estimaciones en dos grupos de edad y con un mismo grupo de calificadores. En la b&uacute;squeda de evidencias psicom&eacute;tricas de los instrumentos de medici&oacute;n, se examin&oacute; el impacto de varias fuentes de error, especialmente de las diferencias entre calificadores y la consistencia interna (Anastasi &amp; Urbina, 1997); y si ocurre una relaci&oacute;n entre el nivel de desempe&ntilde;o en los dibujos y el nivel de acuerdo entre los calificadores, tal como se ha reportado y sugerido en investigaciones similares (Aylward &amp; Smidth, 1986; Reynolds &amp; Hickman (2004).</p>
    <p>En lo concerniente a la consistencia interna, se hall&oacute; que las estimaciones fueron relativamente bajas entre los ni&ntilde;os de m&aacute;s edad, y que estuvieron relacionadas con el grado de acuerdo entre los calificadores as&iacute; como en la dispersi&oacute;n de los puntajes. Los dise&ntilde;os reproducidos por ni&ntilde;os de mayor edad tendieron a ser menos variables, y dado que sus funciones integrativas son m&aacute;s desarrolladas en los ni&ntilde;os de menor edad, sus puntajes tendr&aacute;n distribuciones asim&eacute;tricamente negativas y posiblemente menos variables. Este resultado debe sugerir que el entrenamiento as&iacute; como una adecuada estimaci&oacute;n del acuerdo, deben ser componentes importantes en el control de calidad de evaluaciones que demanda el juicio o un elevado grado de subjetividad en la asignaci&oacute;n de los puntajes. La relativa inestabilidad de la consistencia interna en el presente estudio, a&uacute;n no podr&iacute;a considerarse como un resultados fijo, pues el coeficiente alfa, as&iacute; como otras estimaciones derivadas de la teor&iacute;a cl&aacute;sica de los test son dependientes de la muestra (Feldt &amp; Brennan, 1989) puede ser un efecto del tama&ntilde;o muestral.</p>
    <p>En lo concerniente al acuerdo intercalificadores, hemos hallado un adecuado consenso entre los puntajes totales que generan varios calificadores, pero, en contraste, se observaron discrepancias en el acuerdo a nivel del &iacute;tem. Tambi&eacute;n se encontr&oacute; que el acuerdo fue mejor en la calificaci&oacute;n de los protocolos de los ni&ntilde;os de menor edad. Es posible que los calificadores tendieran a usar los criterios de puntuaci&oacute;n ilusoriamente m&aacute;s confiadas, ya que su experiencia y acierto durante la calificaci&oacute;n de los protocolos de los ni&ntilde;os de menor edad les dio m&aacute;s seguridad en el manejo del SCC, y recurrieran con menor frecuencia a los ejemplos de puntuaci&oacute;n de manual. Por lo tanto, en la situaci&oacute;n de dudar qu&eacute; puntuaci&oacute;n asignar a una reproducci&oacute;n, no las habr&iacute;an comparado con los ejemplos del manual y habr&iacute;an aplicado inconsistentemente el criterio clave. Esta evaluaci&oacute;n hecha por cada calificador podr&iacute;a generar las inconsistencias y mayor desacuerdo al calificar a los ni&ntilde;os del segundo nivel de edad. Este problema tiene especial importancia para el entrenamiento en pruebas visomotoras, considerando que tienden a utilizarse con frecuencia en la evaluaciones neuropsicol&oacute;gicas y psicopedag&oacute;gicas (Sattler, 1996). Los resultados sugieren que se hallar&iacute;an discrepancias severas entre los calificadores si se examina la calificaci&oacute;n a nivel del &iacute;tem, y la dificultad de la reproducci&oacute;n no es efecto fijo que causalmente puede explicar estas discrepancias. Esto no apoya la afirmaci&oacute;n de Aylward y Smidth (1986) ni la hip&oacute;tesis de Reynolds y Hickman (2004), pues en este estudio se hall&oacute; el patr&oacute;n opuesto: los dibujos de los ni&ntilde;os de mayor edad fue el contexto del mayor desacuerdo entre los calificadores.</p>
    <p>Pero el acuerdo hallado, en general, ha sido aceptable para uso cl&iacute;nico, y es comparable con lo reportado en el manual; sin embargo, en los estudios (como los reportados por el manual) generalmente se usan coeficientes de correlaci&oacute;n de Pearson en lugar de otros m&aacute;s apropiados y que sean sensibles no solo a los cambios monot&oacute;nicos de los puntajes, sino tambi&eacute;n a la magnitud de los mismos, seg&uacute;n han sido asignados por los calificadores (Cone, 1999). Por lo tanto, nuestras estimaciones del acuerdo suponen una mejor estimaci&oacute;n que lo reportado por el manual.</p>
    <p>Una limitaci&oacute;n de nuestro estudio es que la diferencia en el desempe&ntilde;o ocasionadas entre la aplicaci&oacute;n individual y grupal, podr&iacute;a ser una hip&oacute;tesis rival que podr&iacute;a explicar una parte de las diferencias entre los grupos de edad, pero las autoras consideran que son de menor impacto; hay referencias que la variaci&oacute;n en la administraci&oacute;n no produce efectos fijos, sino m&aacute;s bien aleatorios, que bajo condiciones estandarizadas, no alteran el desempe&ntilde;o visomotor (Caskey &amp; Larson, 1977, 1980)</p>
    <p>Los manuales de las pruebas reportan importante informaci&oacute;n, pero dado que generalmente se usa la teor&iacute;a cl&aacute;sica de los test para la evaluaci&oacute;n psicom&eacute;trica, estos son dependientes de la muestra (AERA, APA &amp; NCME, 1999); por lo tanto, deber&iacute;an replicarse la confiabilidad en la muestra de estudio e incluso en la pr&aacute;ctica profesional mediante la solicitud a otro profesional que califique tambi&eacute;n las reproducciones de los ni&ntilde;os (Williams et al., 2006). Finalmente, una vez establecido el acuerdo entre calificadores del equipo de trabajo o investigaci&oacute;n, se puede calificar el DAP:IQ independientemente y sus puntajes intercambiables con otros calificadores.</p>
    <p>El dise&ntilde;o descriptivo de nuestro estudio no permite hacer inferencias causales (Christensen, 2001) sobre el motivo del desacuerdo o el acuerdo, y limita la eficiencia del control sobre numerosas fuentes que podr&iacute;an invalidar nuestras conclusiones, pero puede dar un respaldo favorable a la generalizabilidad de los resultados obtenidos, considerando que las condiciones de recolecci&oacute;n y evaluaci&oacute;n del acuerdo, se pueden empatar con lo que usualmente el profesional encuentra en su pr&aacute;ctica psicopedag&oacute;gica, en la ense&ntilde;anza de pruebas psicol&oacute;gicas o en la investigaci&oacute;n de campo. Un an&aacute;lisis normativo no fue posible en este estudio, pues el tama&ntilde;o muestral no permitir&iacute;a obtener estad&iacute;sticos estables (Nunally &amp; Bernstein, 1995); por lo tanto, una evaluaci&oacute;n parcial de la universalidad de este sistema como un indicador de desarrollo vasomotor, requerir&aacute; un mayor tama&ntilde;o muestral y un adecuado dise&ntilde;o de muestreo para obtener normas representativas. A&uacute;n con estas limitaciones, la presente investigaci&oacute;n explor&oacute; la normalidad de la distribuci&oacute;n de los puntajes, y &eacute;sta se acerc&oacute; a tal distribuci&oacute;n como para hacer razonables ajustes para determinar normas provisionales. Sin embargo, una muestra de mayor tama&ntilde;o y demogr&aacute;ficamente representativa debe ser un prerrequisito para obtener normas confiables. Por lo tanto, los par&aacute;metros psicom&eacute;tricos hallados aqu&iacute;, dan un aporte inicial para mirar en esta direcci&oacute;n cuando se busca por recursos modernos de evaluaci&oacute;n del &aacute;rea visomotora.</p>
    <p>Considerando el examen del acuerdo intercalificadores ejemplificado aqu&iacute;, debe ser un an&aacute;lisis sine qua non en medidas que involucran la subjetividad del evaluador, y desde la cual se produce la principal fuente de error en los puntajes en este tipo de evaluaciones (Anastasi &amp; Urbina, 1997); y se puede considerar v&aacute;lida esta recomendaci&oacute;n en situaciones de investigaci&oacute;n como en la experiencia del evaluador en pr&aacute;ctica profesional. Por &uacute;ltimo, respecto al sistema de calificaci&oacute;n de Brannigan y Brunner, las evidencias aqu&iacute; presentadas siguieren una potencial herramienta para la evaluaci&oacute;n de ni&ntilde;os en el &aacute;rea escolar. Dado que esta investigaci&oacute;n es una iniciativa psicom&eacute;trica no concluyente, se prescribe la continuidad de la investigaci&oacute;n en esta l&iacute;nea, y la expansi&oacute;n del estudio hacia los correlatos de rendimiento, inteligencia, y aspectos emocionales que definan la red nomol&oacute;gica de esta versi&oacute;n del TGB.</p>
<hr>
    ]]></body>
<body><![CDATA[<p><b>Referencias</b></p>
    <!-- ref --><p>Alsawalmeh, Y. M. &amp; Feldt, L .S. (1992). Test of the hypothesis that the intraclass reliability coefficient is the same for two measurement procedures. <i>Applied Psychological Measurement, 16, </i>195-205.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000064&pid=S1657-9267201100010001900001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>American Educational Research Association, American Psychological Association &amp; National Council on Measurement in Education. (1999). <i>Standards for educational and psychological testing. </i>Washington, DC: American Psychological Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000066&pid=S1657-9267201100010001900002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Anastasi, A. &amp; Urbina, S. (1997). <i>Psychological testing. </i>Upper Saddle River, NJ: Prentice-Hall.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000068&pid=S1657-9267201100010001900003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Aylward, E. H. &amp; Smidth, S. (1986). An examination of three test of visual-motor integration. <i>Journal of Learning Disabilities, 19(6), </i>328-330.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000070&pid=S1657-9267201100010001900004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Bender, L. (1987). <i>El Test Guest&aacute;ltico Visomotor: usos y aplicaciones cl&iacute;nicas. </i>Buenos Aires: Paid&oacute;s.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000072&pid=S1657-9267201100010001900005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Berdicewski, O. &amp; Milicic, N. (2004). <i>Prueba de Funciones B&aacute;sicas </i>(35<sup>ta</sup> ed.). Santiago: Editorial Universitaria.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000074&pid=S1657-9267201100010001900006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Brannigan, G. G. &amp; Brunner, N. A. (1989). <i>The modified version of the Bender-Gestalt Test for preschool and primary school children. </i>Brandon, VT: Clinical Psychology.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000076&pid=S1657-9267201100010001900007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Brannigan, G. G. &amp; Brunner, N. A. (1996). <i>The modified version of Bender-Gestalt Test for preschool and primary school children </i>(Revised). Brandon, VT: Clinical Psychology Publishing.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000078&pid=S1657-9267201100010001900008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Brannigan, G. G. &amp; Brunner, N. A. (2002). <i>Guide to the Qualitative Scoring System for the modified version of the Bender-Gestalt Test </i>(2<sup>nd</sup> ed.). Chicago, IL: Charles C. Thomas.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000080&pid=S1657-9267201100010001900009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Brannigan, G. G. &amp; Decker, S. L. (2003). <i>Bender Visual-Motor Gestalt Test </i>(2<sup>nd</sup> ed.). Itasca, IL: Riverside Publishing.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000082&pid=S1657-9267201100010001900010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Brannigan, G. G. &amp; Decker, S. L. (2006). The Bender-Gestalt II. <i>American Journal of Orthopsychiatry, 76, </i>10-12.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000084&pid=S1657-9267201100010001900011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Caskey, W. E., Jr. &amp; Larson G. L. (1977). Two modes of administration of the Bender Visual-Motor Gestalt Test to kindergarten children. <i>Perceptual and Motor Skills, </i>45(3), 1003-1006.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000086&pid=S1657-9267201100010001900012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Caskey, W. E., Jr. &amp; Larson, G. (1980). Scores on group and individually administered Bender Gestalt Test and Otis Lennon IQs of kindergarten children. <i>Perceptual and Motor Skills, 50, </i>387-390.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000088&pid=S1657-9267201100010001900013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Chang, P W. (2001). Comparison of visual motor development in Hong Kong and USA assessed on the Qualitative Scoring System for the Modified Bender Gestalt Test. <i>Psychology Reports, 88, </i>236-240.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000090&pid=S1657-9267201100010001900014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Chang, P W. (2002). Relationship of the visual motor development and academic performance in young children in Hong Kong assessed in the Bender-Gestalt Test. <i>Perceptual and Motor Skills, 90, </i>209-214.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000092&pid=S1657-9267201100010001900015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Charter, R. A. (2003). A breakdown of reliability coefficients by test type and reliability method, and clinical implications of low reliability. <i>The Journal of General Psychology, 130(3), </i>290-304.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000094&pid=S1657-9267201100010001900016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Cicchetti, D. V. &amp; Sparrow, S. S. (1981). Developing criteria for establishing the interrater reliability of specific items in a given inventory. <i>American Journal of Mental Deficiency, 86, </i>127-137.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000096&pid=S1657-9267201100010001900017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Cicchetti, D. V. (1994). Guidelines, criteria, and rules of thumb for evaluating normed and estandardized assessment instruments in psychology. <i>Psychological Assessment, 6, </i>284-290.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000098&pid=S1657-9267201100010001900018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Cone, J. D. (1999). Observational assessment: Measure development and research issues. In P. C. Kendall, J. N. Burcher &amp; G. N. Holmbeck, <i>Handbook of Research Methods in Clinical Psychology </i>(2<sup>nd</sup> ed., pp. 183-223). New York: John Wiley &amp; Sons.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000100&pid=S1657-9267201100010001900019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Christensen, L. B. (2001). <i>Experimental methodology </i>(8<sup>th </sup>ed.). Needham Heights, Massachusetts: Allyn &amp; Bacon.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000102&pid=S1657-9267201100010001900020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. <i>Psychometrika. 16, </i>297-334.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000104&pid=S1657-9267201100010001900021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Decker, S. L. (2008). Measuring growth and decline in visual-motor processes with the Bender Gestalt second edition. <i>Journal of Psychoeducational Assessment, </i>26(1), 3-15.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000106&pid=S1657-9267201100010001900022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Feldt, L. S. &amp; Brennan, R. L. (1989). Reliability. In R. L. Linn (Ed.), <i>Educational measurement </i>(3<sup>rd</sup> ed., pp. 105-146). New York: American Council on Education/Macmillan.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000108&pid=S1657-9267201100010001900023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Fuller, G. B. &amp; Vance, B. (1995). Interscorer reliability of the modified version of the Bender-Gestalt Test for preschool and primary school children. <i>Psychology in the Schools, </i>32(4), 264-266.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000110&pid=S1657-9267201100010001900024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Hustak, T. L., Dinning, W. D. &amp; Andert, J. N. (1976). Reliability of the Koppitz scoring system for the Bender Gestalt Test. <i>Journal of Clinical Psychology, </i>32(2), 468-469.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000112&pid=S1657-9267201100010001900025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Jansky, J. &amp; de Hirsch, K. (1972). <i>Preventing reading failure: Prediction, diagnosis, intervention. </i>New York: Harper and Row.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000114&pid=S1657-9267201100010001900026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Johnston, C. W. &amp; Lanak, B. (1985) Comparison of the Koppitz and Watkins Scoring Systems for the Bender Gestalt Test. <i>Journal of Learning Disabilities, 18(7) </i>377-378.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000116&pid=S1657-9267201100010001900027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Koppitz, E. M. (1963). <i>The Bender-Gestalt Test for young children </i>(2<sup>nd</sup> ed.). New York: Grune &amp; Stratton.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000118&pid=S1657-9267201100010001900028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Koppitz, E. M. (1984). <i>El test gest&aacute;ltico visomotor para ni&ntilde;os </i>(10<sup>a</sup> ed.). Buenos Aires: Guadalupe.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000120&pid=S1657-9267201100010001900029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Lautenschlager, G. J. &amp; Meade, A. W. (2008). AlphaTest: A windows program for tests of hypotheses about coefficient alpha. <i>Applied Psychological Measurement, 23, </i>502-503.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000122&pid=S1657-9267201100010001900030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Lipsey, M. W. &amp; Wilson, D. B. (2001). <i>Practical metaanalysis. </i>Thousand Oaks: Sage.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000124&pid=S1657-9267201100010001900031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov Test for Normality with mean and variance unknown. <i>Journal of the American Statistical Association, 62, </i>399-402.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000126&pid=S1657-9267201100010001900032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Merino, C. &amp; Lautenschlager, G. (2003). Comparaci&oacute;n estad&iacute;stica de la confiabilidad alfa de Cronbach: aplicaciones en la medici&oacute;n educacional. <i>Revista de Psicolog&iacute;a, 12(1), </i>129-139.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000128&pid=S1657-9267201100010001900033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Merino, C. (2009). <i>ICC COMPARE: A MS Excel program for testing equality of intraclass reliability coefficients. </i>Documento no publicado.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000130&pid=S1657-9267201100010001900034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Morsbach, G., Priori, C. D. &amp; Firnell, J. (1975). Two aspects of scorer reliability in the Bender-Gestalt test. <i>Journal of Clinical Psychology, 31 </i>(1), 90-93.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000132&pid=S1657-9267201100010001900035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Nunally, J. &amp; Bernstein, J. (1995). <i>Teor&iacute;a psicom&eacute;trica. </i>M&eacute;xico, DF: McGraw-Hill.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000134&pid=S1657-9267201100010001900036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Palisano, R. L. &amp; Dichter, C. G. (1989). Comparison of two tests of visual-motor development used to assess children with learning disabilities. <i>Perceptual and Motor Skills, </i>68(3), 1009-1103.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000136&pid=S1657-9267201100010001900037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Parsons, L. &amp; Weinberg, S. L. (1993). The Sugar Scoring System for the Bender-Gestalt. <i>Perceptual and Motor Skills, 77, </i>883-893.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000138&pid=S1657-9267201100010001900038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Rae, G. &amp; Hyland, IP (2001). Generalisability and classical test theory analysis of Koppit'z Scoring System for human figure drawings. <i>British Journal of Educational Psychology, 71, </i>369-182.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000140&pid=S1657-9267201100010001900039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Reynolds, C. R. &amp; Hickman, J. A. (2004). <i>Draw-A-Person Intellectual Ability Test for children, adolescents, and adults (DAP:IQ). </i>Austin: PRO-ED.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000142&pid=S1657-9267201100010001900040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Reynolds, C. R. (2007). <i>Koppitz Developmental Scoring System for the Bender Gestalt Test: Examiner's manual </i>(2<sup>nd</sup> ed.). Austin, TX: Pro-Ed.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000144&pid=S1657-9267201100010001900041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Rossini, E. D. (1993). The Bender-Gestalt psychopathology scale: Failure to infer validity in a school-aged sample. <i>Journal of Personality Assessment, 60</i>(3), 605.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000146&pid=S1657-9267201100010001900042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Shapiro, S. S. &amp; Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). <i>Biometrika, 52, </i>591-611.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000148&pid=S1657-9267201100010001900043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Sattler, J. (2003). <i>Evaluaci&oacute;n de la inteligencia infantil y habilidades especiales. </i>M&eacute;xico: Manual Moderno.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000150&pid=S1657-9267201100010001900044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Simner, M. L. (1991). Estimating a child's learning potential from form errors in a child's printing. In J. Wann, A. M. Wing &amp; N. Sovik (Eds.), <i>Development of graphics skills: Research, perspectives, and educational implications </i>(pp. 205-222). London: Academic Press Inc.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000152&pid=S1657-9267201100010001900045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Simner, M. L. &amp; Barnes, M. J. (1991). Relationship between first-grade marks and the high school dropout problem. <i>Journal of School Psychology, 29, </i>331-335.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000154&pid=S1657-9267201100010001900046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Sugar, F. R. (1995). <i>Sugar Scoring System for the Bender-Gestalt Test. </i>Boston, MA: Educator Publishing Service.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000156&pid=S1657-9267201100010001900047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Svensson, P W. &amp; Hill, M. A. (1990). Interrater reliability of the Koppitz Developmental Scoring method in the clinical evaluation of the single case. <i>Perceptual and Motor Skills, </i>70(2), 615-623.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000158&pid=S1657-9267201100010001900048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Watkins, E. O. (1976). <i>Watkins Bender-Gestalt Scoring System. </i>Novato, CA: Academic Therapy Publications.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000160&pid=S1657-9267201100010001900049&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
    <!-- ref --><p>Williams, T. O., Jr., Fall, A., Eaves, R. C. &amp; Woods-Groves, S. (2006). The reliability of scores for the Draw-A-Person intellectual ability test for children, adolescents, and adults. <i>Journal of Psychoeducational Assessment, 24</i>(2), 137-144.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000162&pid=S1657-9267201100010001900050&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>
</font>
     ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Alsawalmeh]]></surname>
<given-names><![CDATA[Y. M]]></given-names>
</name>
<name>
<surname><![CDATA[Feldt]]></surname>
<given-names><![CDATA[L .S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Test of the hypothesis that the intraclass reliability coefficient is the same for two measurement procedures]]></article-title>
<source><![CDATA[Applied Psychological Measurement]]></source>
<year>1992</year>
<volume>16</volume>
<page-range>195-205</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<collab>American Educational Research Association, American Psychological Association</collab>
<source><![CDATA[Standards for educational and psychological testing]]></source>
<year>1999</year>
<publisher-loc><![CDATA[Washington^eDC DC]]></publisher-loc>
<publisher-name><![CDATA[American Psychological Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anastasi]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Urbina]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<source><![CDATA[Psychological testing]]></source>
<year>1997</year>
<publisher-loc><![CDATA[Upper Saddle River^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[Prentice-Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aylward]]></surname>
<given-names><![CDATA[E. H]]></given-names>
</name>
<name>
<surname><![CDATA[Smidth]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An examination of three test of visual-motor integration]]></article-title>
<source><![CDATA[Journal of Learning Disabilities]]></source>
<year>1986</year>
<volume>19</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>328-330</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bender]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[El Test Guestáltico Visomotor: usos y aplicaciones clínicas]]></source>
<year>1987</year>
<publisher-loc><![CDATA[Buenos Aires ]]></publisher-loc>
<publisher-name><![CDATA[Paidós]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Berdicewski]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
<name>
<surname><![CDATA[Milicic]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[Prueba de Funciones Básicas]]></source>
<year>2004</year>
<edition>35</edition>
<publisher-loc><![CDATA[Santiago ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Universitaria]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brannigan]]></surname>
<given-names><![CDATA[G. G]]></given-names>
</name>
<name>
<surname><![CDATA[Brunner]]></surname>
<given-names><![CDATA[N. A]]></given-names>
</name>
</person-group>
<source><![CDATA[The modified version of the Bender-Gestalt Test for preschool and primary school children]]></source>
<year>1989</year>
<publisher-loc><![CDATA[Brandon^eVT VT]]></publisher-loc>
<publisher-name><![CDATA[Clinical Psychology]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brannigan]]></surname>
<given-names><![CDATA[G. G]]></given-names>
</name>
<name>
<surname><![CDATA[Brunner]]></surname>
<given-names><![CDATA[N. A]]></given-names>
</name>
</person-group>
<source><![CDATA[The modified version of Bender-Gestalt Test for preschool and primary school children (Revised)]]></source>
<year>1996</year>
<publisher-loc><![CDATA[Brandon^eVT VT]]></publisher-loc>
<publisher-name><![CDATA[Clinical Psychology Publishing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brannigan]]></surname>
<given-names><![CDATA[G. G]]></given-names>
</name>
<name>
<surname><![CDATA[Brunner]]></surname>
<given-names><![CDATA[N. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Guide to the Qualitative Scoring System for the modified version of the Bender-Gestalt Test]]></source>
<year>2002</year>
<edition>2</edition>
<publisher-loc><![CDATA[Chicago^eIL IL]]></publisher-loc>
<publisher-name><![CDATA[Charles C. Thomas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brannigan]]></surname>
<given-names><![CDATA[G. G]]></given-names>
</name>
<name>
<surname><![CDATA[Decker]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
</person-group>
<source><![CDATA[Bender Visual-Motor Gestalt Test]]></source>
<year>2003</year>
<edition>2</edition>
<publisher-loc><![CDATA[Itasca^eIL IL]]></publisher-loc>
<publisher-name><![CDATA[Riverside Publishing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brannigan]]></surname>
<given-names><![CDATA[G. G]]></given-names>
</name>
<name>
<surname><![CDATA[Decker]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Bender-Gestalt II]]></article-title>
<source><![CDATA[American Journal of Orthopsychiatry]]></source>
<year>2006</year>
<volume>76</volume>
<page-range>10-12</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Caskey]]></surname>
<given-names><![CDATA[W. E., Jr]]></given-names>
</name>
<name>
<surname><![CDATA[Larson]]></surname>
<given-names><![CDATA[G. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Two modes of administration of the Bender Visual-Motor Gestalt Test to kindergarten children]]></article-title>
<source><![CDATA[Perceptual and Motor Skills]]></source>
<year>1977</year>
<volume>45</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>1003-1006</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Caskey]]></surname>
<given-names><![CDATA[W. E., Jr]]></given-names>
</name>
<name>
<surname><![CDATA[Larson]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Scores on group and individually administered Bender Gestalt Test and Otis Lennon IQs of kindergarten children]]></article-title>
<source><![CDATA[Perceptual and Motor Skills]]></source>
<year>1980</year>
<volume>50</volume>
<page-range>387-390</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chang]]></surname>
<given-names><![CDATA[P W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comparison of visual motor development in Hong Kong and USA assessed on the Qualitative Scoring System for the Modified Bender Gestalt Test]]></article-title>
<source><![CDATA[Psychology Reports]]></source>
<year>2001</year>
<volume>88</volume>
<page-range>236-240</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chang]]></surname>
<given-names><![CDATA[P W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Relationship of the visual motor development and academic performance in young children in Hong Kong assessed in the Bender-Gestalt Test]]></article-title>
<source><![CDATA[Perceptual and Motor Skills]]></source>
<year>2002</year>
<volume>90</volume>
<page-range>209-214</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Charter]]></surname>
<given-names><![CDATA[R. A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A breakdown of reliability coefficients by test type and reliability method, and clinical implications of low reliability]]></article-title>
<source><![CDATA[The Journal of General Psychology]]></source>
<year>2003</year>
<volume>130</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>290-304</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cicchetti]]></surname>
<given-names><![CDATA[D. V]]></given-names>
</name>
<name>
<surname><![CDATA[Sparrow]]></surname>
<given-names><![CDATA[S. S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Developing criteria for establishing the interrater reliability of specific items in a given inventory]]></article-title>
<source><![CDATA[American Journal of Mental Deficiency]]></source>
<year>1981</year>
<volume>86</volume>
<page-range>127-137</page-range></nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cicchetti]]></surname>
<given-names><![CDATA[D. V]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Guidelines, criteria, and rules of thumb for evaluating normed and estandardized assessment instruments in psychology]]></article-title>
<source><![CDATA[Psychological Assessment]]></source>
<year>1994</year>
<volume>6</volume>
<page-range>284-290</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cone]]></surname>
<given-names><![CDATA[J. D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Observational assessment: Measure development and research issues]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Kendall]]></surname>
<given-names><![CDATA[P. C]]></given-names>
</name>
<name>
<surname><![CDATA[Burcher]]></surname>
<given-names><![CDATA[J. N]]></given-names>
</name>
<name>
<surname><![CDATA[Holmbeck]]></surname>
<given-names><![CDATA[G. N]]></given-names>
</name>
</person-group>
<source><![CDATA[Handbook of Research Methods in Clinical Psychology]]></source>
<year>1999</year>
<edition>2</edition>
<page-range>183-223</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley & Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Christensen]]></surname>
<given-names><![CDATA[L. B]]></given-names>
</name>
</person-group>
<source><![CDATA[Experimental methodology]]></source>
<year>2001</year>
<edition>8</edition>
<publisher-loc><![CDATA[Needham Heights^eMassachusetts Massachusetts]]></publisher-loc>
<publisher-name><![CDATA[Allyn & Bacon]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cronbach]]></surname>
<given-names><![CDATA[L. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Coefficient alpha and the internal structure of tests]]></article-title>
<source><![CDATA[Psychometrika]]></source>
<year>1951</year>
<volume>16</volume>
<page-range>297-334</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Decker]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Measuring growth and decline in visual-motor processes with the Bender Gestalt second edition]]></article-title>
<source><![CDATA[Journal of Psychoeducational Assessment]]></source>
<year>2008</year>
<volume>26</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>3-15</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Feldt]]></surname>
<given-names><![CDATA[L. S]]></given-names>
</name>
<name>
<surname><![CDATA[Brennan]]></surname>
<given-names><![CDATA[R. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reliability]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Linn]]></surname>
<given-names><![CDATA[R. L]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational measurement]]></source>
<year>1989</year>
<edition>3</edition>
<page-range>105-146</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[American Council on Education/Macmillan]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fuller]]></surname>
<given-names><![CDATA[G. B]]></given-names>
</name>
<name>
<surname><![CDATA[Vance]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Interscorer reliability of the modified version of the Bender-Gestalt Test for preschool and primary school children]]></article-title>
<source><![CDATA[Psychology in the Schools]]></source>
<year>1995</year>
<volume>32</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>264-266</page-range></nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hustak]]></surname>
<given-names><![CDATA[T. L]]></given-names>
</name>
<name>
<surname><![CDATA[Dinning]]></surname>
<given-names><![CDATA[W. D]]></given-names>
</name>
<name>
<surname><![CDATA[Andert]]></surname>
<given-names><![CDATA[J. N]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reliability of the Koppitz scoring system for the Bender Gestalt Test]]></article-title>
<source><![CDATA[Journal of Clinical Psychology]]></source>
<year>1976</year>
<volume>32</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>468-469</page-range></nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jansky]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[de Hirsch]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[Preventing reading failure: Prediction, diagnosis, intervention]]></source>
<year>1972</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Harper and Row]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Johnston]]></surname>
<given-names><![CDATA[C. W]]></given-names>
</name>
<name>
<surname><![CDATA[Lanak]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comparison of the Koppitz and Watkins Scoring Systems for the Bender Gestalt Test]]></article-title>
<source><![CDATA[Journal of Learning Disabilities]]></source>
<year>1985</year>
<volume>18</volume>
<numero>7</numero>
<issue>7</issue>
<page-range>377-378</page-range></nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Koppitz]]></surname>
<given-names><![CDATA[E. M]]></given-names>
</name>
</person-group>
<source><![CDATA[The Bender-Gestalt Test for young children]]></source>
<year>1963</year>
<edition>2</edition>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Grune & Stratton]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Koppitz]]></surname>
<given-names><![CDATA[E. M]]></given-names>
</name>
</person-group>
<source><![CDATA[El test gestáltico visomotor para niños]]></source>
<year>1984</year>
<edition>10</edition>
<publisher-loc><![CDATA[Buenos Aires ]]></publisher-loc>
<publisher-name><![CDATA[Guadalupe]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lautenschlager]]></surname>
<given-names><![CDATA[G. J]]></given-names>
</name>
<name>
<surname><![CDATA[Meade]]></surname>
<given-names><![CDATA[A. W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[AlphaTest: A windows program for tests of hypotheses about coefficient alpha]]></article-title>
<source><![CDATA[Applied Psychological Measurement]]></source>
<year>2008</year>
<volume>23</volume>
<page-range>502-503</page-range></nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lipsey]]></surname>
<given-names><![CDATA[M. W]]></given-names>
</name>
<name>
<surname><![CDATA[Wilson]]></surname>
<given-names><![CDATA[D. B]]></given-names>
</name>
</person-group>
<source><![CDATA[Practical metaanalysis]]></source>
<year>2001</year>
<publisher-loc><![CDATA[Thousand Oaks ]]></publisher-loc>
<publisher-name><![CDATA[Sage]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lilliefors]]></surname>
<given-names><![CDATA[H. W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the Kolmogorov-Smirnov Test for Normality with mean and variance unknown]]></article-title>
<source><![CDATA[Journal of the American Statistical Association]]></source>
<year>1967</year>
<volume>62</volume>
<page-range>399-402</page-range></nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Merino]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Lautenschlager]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Comparación estadística de la confiabilidad alfa de Cronbach: aplicaciones en la medición educacional]]></article-title>
<source><![CDATA[Revista de Psicología]]></source>
<year>2003</year>
<volume>12</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>129-139</page-range></nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Merino]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[ICC COMPARE: A MS Excel program for testing equality of intraclass reliability coefficients]]></source>
<year>2009</year>
</nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Morsbach]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Priori]]></surname>
<given-names><![CDATA[C. D]]></given-names>
</name>
<name>
<surname><![CDATA[Firnell]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Two aspects of scorer reliability in the Bender-Gestalt test]]></article-title>
<source><![CDATA[Journal of Clinical Psychology]]></source>
<year>1975</year>
<volume>31</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>90-93</page-range></nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nunally]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Bernstein]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Teoría psicométrica]]></source>
<year>1995</year>
<publisher-loc><![CDATA[México^eDF DF]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Palisano]]></surname>
<given-names><![CDATA[R. L]]></given-names>
</name>
<name>
<surname><![CDATA[Dichter]]></surname>
<given-names><![CDATA[C. G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comparison of two tests of visual-motor development used to assess children with learning disabilities]]></article-title>
<source><![CDATA[Perceptual and Motor Skills]]></source>
<year>1989</year>
<volume>68</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>1009-1103</page-range></nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Parsons]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Weinberg]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Sugar Scoring System for the Bender-Gestalt]]></article-title>
<source><![CDATA[Perceptual and Motor Skills]]></source>
<year>1993</year>
<volume>77</volume>
<page-range>883-893</page-range></nlm-citation>
</ref>
<ref id="B39">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rae]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Hyland]]></surname>
<given-names><![CDATA[IP]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Generalisability and classical test theory analysis of Koppit'z Scoring System for human figure drawings]]></article-title>
<source><![CDATA[British Journal of Educational Psychology]]></source>
<year>2001</year>
<volume>71</volume>
<page-range>369-182</page-range></nlm-citation>
</ref>
<ref id="B40">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Reynolds]]></surname>
<given-names><![CDATA[C. R]]></given-names>
</name>
<name>
<surname><![CDATA[Hickman]]></surname>
<given-names><![CDATA[J. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Draw-A-Person Intellectual Ability Test for children, adolescents, and adults (DAP:IQ)]]></source>
<year>2004</year>
<publisher-loc><![CDATA[Austin ]]></publisher-loc>
<publisher-name><![CDATA[PRO-ED]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B41">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Reynolds]]></surname>
<given-names><![CDATA[C. R]]></given-names>
</name>
</person-group>
<source><![CDATA[Koppitz Developmental Scoring System for the Bender Gestalt Test: Examiner's manual]]></source>
<year>2007</year>
<edition>2</edition>
<publisher-loc><![CDATA[Austin^eTX TX]]></publisher-loc>
<publisher-name><![CDATA[Pro-Ed]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B42">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rossini]]></surname>
<given-names><![CDATA[E. D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Bender-Gestalt psychopathology scale: Failure to infer validity in a school-aged sample]]></article-title>
<source><![CDATA[Journal of Personality Assessment]]></source>
<year>1993</year>
<volume>60</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>605</page-range></nlm-citation>
</ref>
<ref id="B43">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shapiro]]></surname>
<given-names><![CDATA[S. S]]></given-names>
</name>
<name>
<surname><![CDATA[Wilk]]></surname>
<given-names><![CDATA[M. B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An analysis of variance test for normality (complete samples)]]></article-title>
<source><![CDATA[Biometrika]]></source>
<year>1965</year>
<volume>52</volume>
<page-range>591-611</page-range></nlm-citation>
</ref>
<ref id="B44">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sattler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Evaluación de la inteligencia infantil y habilidades especiales]]></source>
<year>2003</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Manual Moderno]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B45">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Simner]]></surname>
<given-names><![CDATA[M. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Estimating a child's learning potential from form errors in a child's printing]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Wann]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Wing]]></surname>
<given-names><![CDATA[A. M]]></given-names>
</name>
<name>
<surname><![CDATA[Sovik]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[Development of graphics skills: Research, perspectives, and educational implications]]></source>
<year>1991</year>
<page-range>205-222</page-range><publisher-loc><![CDATA[London ]]></publisher-loc>
<publisher-name><![CDATA[Academic Press Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B46">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Simner]]></surname>
<given-names><![CDATA[M. L]]></given-names>
</name>
<name>
<surname><![CDATA[Barnes]]></surname>
<given-names><![CDATA[M. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Relationship between first-grade marks and the high school dropout problem]]></article-title>
<source><![CDATA[Journal of School Psychology]]></source>
<year>1991</year>
<volume>29</volume>
<page-range>331-335</page-range></nlm-citation>
</ref>
<ref id="B47">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sugar]]></surname>
<given-names><![CDATA[F. R]]></given-names>
</name>
</person-group>
<source><![CDATA[Sugar Scoring System for the Bender-Gestalt Test]]></source>
<year>1995</year>
<publisher-loc><![CDATA[Boston^eMA MA]]></publisher-loc>
<publisher-name><![CDATA[Educator Publishing Service]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B48">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Svensson]]></surname>
<given-names><![CDATA[P W]]></given-names>
</name>
<name>
<surname><![CDATA[Hill]]></surname>
<given-names><![CDATA[M. A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Interrater reliability of the Koppitz Developmental Scoring method in the clinical evaluation of the single case]]></article-title>
<source><![CDATA[Perceptual and Motor Skills]]></source>
<year>1990</year>
<volume>70</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>615-623</page-range></nlm-citation>
</ref>
<ref id="B49">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Watkins]]></surname>
<given-names><![CDATA[E. O]]></given-names>
</name>
</person-group>
<source><![CDATA[Watkins Bender-Gestalt Scoring System]]></source>
<year>1976</year>
<publisher-loc><![CDATA[Novato^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Academic Therapy Publications]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B50">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Williams]]></surname>
<given-names><![CDATA[T. O., Jr]]></given-names>
</name>
<name>
<surname><![CDATA[Fall]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Eaves]]></surname>
<given-names><![CDATA[R. C]]></given-names>
</name>
<name>
<surname><![CDATA[Woods-Groves]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The reliability of scores for the Draw-A-Person intellectual ability test for children, adolescents, and adults]]></article-title>
<source><![CDATA[Journal of Psychoeducational Assessment]]></source>
<year>2006</year>
<volume>24</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>137-144</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
