<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0124-0064</journal-id>
<journal-title><![CDATA[Revista de Salud Pública]]></journal-title>
<abbrev-journal-title><![CDATA[Rev. salud pública]]></abbrev-journal-title>
<issn>0124-0064</issn>
<publisher>
<publisher-name><![CDATA[Instituto de Salud Publica, Facultad de Medicina - Universidad Nacional de Colombia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0124-00642004000300006</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Validación de escalas de medición en salud]]></article-title>
<article-title xml:lang="en"><![CDATA[Validating scales used for measuring factors in medicine]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Sánchez]]></surname>
<given-names><![CDATA[Ricardo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Echeverry]]></surname>
<given-names><![CDATA[Jairo]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional de Colombia Facultad de Medicina ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Nacional de Colombia Facultad de Medicina ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>11</month>
<year>2004</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>11</month>
<year>2004</year>
</pub-date>
<volume>6</volume>
<numero>3</numero>
<fpage>302</fpage>
<lpage>318</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0124-00642004000300006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0124-00642004000300006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0124-00642004000300006&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Este artículo muestra los aspectos más importantes relacionados con la validación de escalas aplicadas en investigación en salud e ilustra los pasos de este proceso. En el artículo se discuten los conceptos relacionados con la selección de los ítems, traducción, validez, confiabilidad y utilidad.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This article shows the mayor issues related with validation of scales applied in health research and illustrates the steps of this process. Concepts related with the selection of items, translation, validity, reliability and usefulness are discussed in this article.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Estudios de validación]]></kwd>
<kwd lng="es"><![CDATA[reproducibilidad de resultados]]></kwd>
<kwd lng="en"><![CDATA[Validation studies]]></kwd>
<kwd lng="en"><![CDATA[reproducibility of Results]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font size="2" face="Verdana"><B>GUIA/GUIDE</B></font></p>     <p>&nbsp;</p>     <p><font size="4" face="verdana"><B>Validaci&oacute;n de escalas de medici&oacute;n    en salud</b></font></p>     <p>&nbsp;</p>     <p><FONT SIZE="3" FACE="verdana"><B>Validating scales used for measuring factors    in medicine</B></FONT></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><FONT SIZE="2" face="Verdana"><b>Ricardo S&aacute;nchez<SUP>I</sup>; Jairo    Echeverry<SUP>II</sup></b></FONT></p>     <p><FONT SIZE="2" face="Verdana"><SUP>I</sup>M&eacute;dico. Especialista en Psiquiatr&iacute;a.    Especialista en Estad&iacute;stica. M. Sc. Epidemiolog&iacute;a Cl&iacute;nica..    Facultad de Medicina, Universidad Nacional de Colombia. E-mail: <A HREF="mailto:rsanchezpe@unal.edu.co">rsanchezpe@unal.edu.co</A>    <br>   <SUP>II</sup>M&eacute;dico. Especialista en Pediatr&iacute;a. M. Sc. (candidato)    Epidemiolog&iacute;a Cl&iacute;nica. Facultad de Medicina, Universidad Nacional    de Colombia. Correo electr&oacute;nico: <A HREF="mailto:jecheverr@unal.edu.co">jecheverr@unal.edu.co</A></font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p> <hr size="1" noshade>     <p><font size="2" face="Verdana"><B>RESUMEN</B></font></p>     <p><FONT SIZE="2" FACE="Verdana">Este art&iacute;culo muestra los aspectos m&aacute;s    importantes relacionados con la validaci&oacute;n de escalas aplicadas en investigaci&oacute;n    en salud e ilustra los pasos de este proceso. En el art&iacute;culo se discuten    los conceptos relacionados con la selecci&oacute;n de los &iacute;tems, traducci&oacute;n,    validez, confiabilidad y utilidad.</FONT></p>     <p><FONT SIZE="2" FACE="Verdana"><B>Palabras claves:</b> Estudios de validaci&oacute;n,    reproducibilidad de resultados (<I>fuente: DeCS, BIREME</I>).</FONT></p> <hr size="1" noshade>     <p><FONT SIZE="2" FACE="Verdana"><B>ABSTRACT</B></FONT></p>     <p><FONT SIZE="2" FACE="Verdana">This article shows the mayor issues related with    validation of scales applied in health research and illustrates the steps of    this process. Concepts related with the selection of items, translation, validity,    reliability and usefulness are discussed in this article.</FONT></p>     <p><FONT SIZE="2" FACE="Verdana"><B>Key words:</b> Validation studies, reproducibility    of Results (<I>source: DeCS, BIREME</I>).</FONT></p> <hr size="1" noshade>     <p>&nbsp;</p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana">El m&eacute;todo cient&iacute;fico, en su positivismo    l&oacute;gico, se ve avocado a un reduccionismo necesario pero a veces limitante,    que supone colapsar conceptos anat&oacute;micos, fisiol&oacute;gicos, fisiopatol&oacute;gicos,    nosol&oacute;gicos, psicol&oacute;gicos, antropol&oacute;gicos o sociales, en    variables que, como sus representantes, deben ser medidas (1). El establecer    la frecuencia de un evento relacionado con la salud, o determinar los factores    que con &eacute;l se asocian, implica una adecuada selecci&oacute;n de los seres    humanos que ser&aacute;n objeto del estudio y una cuidadosa medici&oacute;n    de caracter&iacute;sticas que denominamos variables (2). Los aciertos o errores    en el proceso de medici&oacute;n de estas variables pueden afectar la validez    de los datos: esto quiere decir que se puede perder la correspondencia entre    el resultado de la medici&oacute;n y la realidad del fen&oacute;meno que se    est&aacute; estudiando. Por lo tanto, medici&oacute;n y validez son dos elementos    inseparables en toda investigaci&oacute;n cient&iacute;fica.</font></p>     <p><FONT size="2" face="Verdana"> De manera elemental la medici&oacute;n se define    como situar algo al lado de un patr&oacute;n de referencia para ver a qu&eacute;    valor de ese patr&oacute;n corresponde. Por ejemplo, existe un patr&oacute;n    de referencia que define al sexo como masculino o femenino, siendo masculino    quien posea un patr&oacute;n cromos&oacute;mico XY y femenino quien lo posea    XX. En este caso el patr&oacute;n de referencia tiene s&oacute;lo dos niveles    de medici&oacute;n que se denominan categor&iacute;as o modalidades.</font></p>     <p><FONT SIZE="2" face="Verdana"> Si un individuo tiene un patr&oacute;n cromos&oacute;mico    XY, queda clasificado o medido como masculino de acuerdo con ese patr&oacute;n    de referencia. Pero sabemos que en la pr&aacute;ctica para clasificar o medir    el sexo no es necesario hacer un estudio cromos&oacute;mico, ni efectuar un    exhaustivo an&aacute;lisis de los genitales externos, ya que simplemente con    el nombre del individuo podemos aproximarnos bastante a esta medici&oacute;n:    esto sucede porque, para medir el sexo, en el necesario proceso reduccionista    a que nos hemos referido, los dos patrones de referencia -estudio cromos&oacute;mico    y nombre- tienen un alto nivel de concordancia.</font></p>     <p><FONT SIZE="2" face="Verdana"> Existen otros patrones de referencia que tienen    un nivel much&iacute;simo mayor de categor&iacute;as: por ejemplo una cinta    m&eacute;trica de 2 metros de longitud marcada cada cent&iacute;metro, tendr&aacute;    200 categor&iacute;as. Si utilizamos este patr&oacute;n de referencia para medir    la estatura y colocamos a un individuo al lado de este patr&oacute;n, podr&iacute;amos    encontrar que el individuo cae en la categor&iacute;a 175: en este caso dir&iacute;amos    que el individuo mide 175 cent&iacute;metros. Aqu&iacute; pierde sentido el    hablar de categor&iacute;as o modalidades y es m&aacute;s adecuado referirse    a intensidad o cantidad de alg&uacute;n atributo (en este caso la estatura)    (3).</font></p>     <p><font size="2" face="Verdana"> En el anterior ejemplo se han definido dos estrategias    de medici&oacute;n:</font></p>     <blockquote>        <p><FONT size="2" face="Verdana">a. Una que permite clasificar o categorizar      a los individuos o unidades de medici&oacute;n, cualifica un atributo.    <br>     b. Otra que cuantifica un atributo.</FONT></p> </blockquote>     <p><font size="2" face="Verdana"> De manera general puede decirse que los patrones    de referencia se pueden concretar a trav&eacute;s de los instrumentos de medici&oacute;n,    de la misma manera que un concepto o cualidad se concreta en una variable. Dependiendo    del dise&ntilde;o del instrumento, puede obtenerse una mejor calidad de la medici&oacute;n:    por ejemplo, una cinta m&eacute;trica marcada en mil&iacute;metros proporciona    una medida m&aacute;s adecuada y real que una marcada en cent&iacute;metros.    En este caso ser&aacute; un mejor instrumento de medici&oacute;n para cuantificar    ese atributo o realidad (4).</font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font size="3" face="Verdana"><b>LA MEDICI&Oacute;N POR MEDIO DE ESCALAS</b></font></p>     <p><font size="2" face="Verdana"> A veces la condici&oacute;n que se quiere medir    no se puede delimitar de manera precisa, o no puede establecerse para ella una    medida simple: este caso es frecuente cuando el fen&oacute;meno de inter&eacute;s    es muy complejo y presenta caracter&iacute;sticas en diferentes niveles, tal    y como ocurre usualmente en fen&oacute;menos psicol&oacute;gicos o sociales,    donde muchos de los diagn&oacute;sticos o definiciones que usualmente se manejan    corresponden a categor&iacute;as m&aacute;s bien inespec&iacute;ficas.</font></p>     <p><font size="2" face="Verdana"> Un ejemplo que permite ilustrar esta situaci&oacute;n    es el s&iacute;ndrome depresivo: asumiendo que este realmente existe, debemos    reconocer que no es posible desarrollar un instrumento que lo mida con precisi&oacute;n    ya que el s&iacute;ndrome mismo est&aacute; imprecisamente definido. Esto equivale    a decir que no existe un verdadero patr&oacute;n de oro para su determinaci&oacute;n,    y que m&aacute;s bien &eacute;ste podr&iacute;a ser construido en funci&oacute;n    de la elaboraci&oacute;n conceptual que haga, para cada condici&oacute;n en    particular, un grupo de expertos en un marco cultural espec&iacute;fico.</font></p>     <p><FONT SIZE="2" face="Verdana">Sabemos que no en todos los pacientes deprimidos    hay tristeza pues en algunos hay anhedonia ( incapacidad para experimentar placer),    que algunos pacientes presentan anorexia mientras que otros tienen hiperfagia,    que no todos los pacientes tienen ideas de culpa, o que algunos pacientes est&aacute;n    motoramente inhibidos mientras que otros est&aacute;n agitados, por citar solo    algunas caracter&iacute;sticas del trastorno. Esto implica que la realidad que    estamos tratando de evaluar no puede ser medida ni observada directamente. Para    efectuar la medici&oacute;n en estos casos se recurre a una estrategia que es    agrupar las caracter&iacute;sticas de la entidad en categor&iacute;as un poco    m&aacute;s gruesas, que siempre est&aacute;n presentes. En el ejemplo anterior    podr&iacute;amos descomponer el s&iacute;ndrome depresivo en las siguientes    categor&iacute;as:</font></p>     <blockquote>        <p><font size="2" face="Verdana">a. Alteraciones del estado de &aacute;nimo.    <br>     b. Alteraciones de la conducta motora.    <br>     c. Alteraciones de funciones aut&oacute;nomas.    <br>     d. Alteraciones del pensamiento y de la funci&oacute;n cognoscitiva.</FONT></p> </blockquote>     <p><FONT SIZE="2" face="Verdana">De esta manera, as&iacute; el paciente est&eacute;    triste o anhed&oacute;nico tendr&aacute; alteraciones del estado de &aacute;nimo;    independientemente de si est&aacute; hipoquin&eacute;tico o agitado, tendr&aacute;    alteraciones en la conducta motora; lo mismo suceder&iacute;a en las otras categor&iacute;as    en las cuales se ha descompuesto el s&iacute;ndrome. El anterior procedimiento    es lo que se conoce como desarrollo de una estructura de Dominios o Factores.</font></p>     ]]></body>
<body><![CDATA[<p><FONT size="2" face="Verdana"> El siguiente paso en la construcci&oacute;n    de escalas es medir cada uno de los Dominios o Factores, lo cual habitualmente    se hace mediante preguntas o aspectos de exploraci&oacute;n espec&iacute;ficos    (&iacute;tem) cuya respuesta o resultado puede darse en un escalamiento categ&oacute;rico    o continuo.</font></p>     <p><FONT SIZE="2" face="Verdana"> La resultante colecci&oacute;n de &iacute;tem    que miden Factores, que a su vez constituyen un s&iacute;ndrome que no es directamente    mensurable, es lo que se denomina una escala (5). Si se toma el listado de preguntas    de la &uacute;ltima columna de la <a href="#tab01">Tabla 1</a>, se tiene una    escala que en este caso ha sido dise&ntilde;ada para la medici&oacute;n de una    realidad que denominamos S&iacute;ndrome Depresivo (6).</font></p>     <p><a name="tab01"></a></p>     <p>&nbsp;</p>     <p align="center"><img src="/img/revistas/rsap/v6n3/a06tab01.gif"></p>     <p>&nbsp;</p>     <p><FONT size="2" face="Verdana"> El ejemplo presentado ilustra el caso de una    escala dise&ntilde;ada para incluir un individuo en una categor&iacute;a. En    otros casos las escalas buscan establecer la intensidad de un atributo, lo cual    es de utilidad cuando se desea establecer la magnitud de una caracter&iacute;stica    a lo largo del tiempo (7).</FONT></p>     <p>&nbsp;</p>     <p><FONT size="3" face="Verdana"><b>¿EN QU&Eacute; CONSISTE Y C&Oacute;MO SE REALIZA    LA VALIDACI&Oacute;N DE UNA ESCALA?</b></font></p>     <p><FONT SIZE="2" face="Verdana">El proceso de construcci&oacute;n de una escala    puede esquematizarse en la siguiente secuencia:</font></p>     ]]></body>
<body><![CDATA[<blockquote>        <p><font size="2" face="Verdana">a. Estamos ante algo que creemos que realmente      existe y que queremos medir.    <br>     b. Lo que queremos medir es un fen&oacute;meno complejo, que no es observable      directamente y que tiene manifestaciones o maneras de expresarse que no son      constantes.    <br>     c. Se descompone lo que queremos medir en grupos de s&iacute;ntomas o manifestaciones      que siempre est&aacute;n presentes. Esos grupos se llaman Factores o Dominios.    <br>     d. Se desarrolla una estrategia para medir los Factores o Dominios, usualmente      mediante la construcci&oacute;n de &iacute;tem.</font></p> </blockquote>     <p><FONT SIZE="2" face="Verdana">Pero este proceso no se detiene aqu&iacute;:    el siguiente paso es "certificar" que la escala tiene ciertas caracter&iacute;sticas    o atributos que hacen meritoria su utilizaci&oacute;n. Esas caracter&iacute;sticas,    de las cuales depende la "certificaci&oacute;n", son:</font></p>     <blockquote>        <p><font size="2" face="Verdana">a. La realidad existente est&aacute; adecuadamente      representada por la escala. En otras palabras, la escala parece medir lo que      debe medir.    <br>     b. La escala refleja la estructura de Dominios o de Factores en los cuales      fue dividida le realidad que se va a medir. En otras palabras, la escala no      deja Factores sin medir, ni mide Dominios que no corresponden a la realidad.    <br>     c. La escala funciona de manera parecida a otros instrumentos para medir esa      realidad que ya han sido "certificados".    ]]></body>
<body><![CDATA[<br>     d. La escala funciona bien bajo diferentes condiciones, por ejemplo cuando      se aplica en diferentes oportunidades o cuando es aplicada por distintas personas.    <br>     e. Cuando la realidad que se est&aacute; midiendo cambia, la escala puede      detectar ese cambio.    <br>     f. La escala es pr&aacute;ctica, f&aacute;cil de aplicar y de procesar.</FONT></p> </blockquote>     <p><font size="2" face="Verdana"> El proceso de "certificaci&oacute;n" que se    ha presentado es lo que se denomina "validaci&oacute;n de escalas". Utilizando    una terminolog&iacute;a t&eacute;cnica, los pasos anteriores pueden describirse    as&iacute;:</font></p>     <blockquote>        <p><FONT size="2" face="Verdana">a. Validez de Apariencia: La escala parece      medir lo que debe medir.    <br>     b. Validez de Constructo: La escala no deja factores sin medir ni mide dominios      que no son del s&iacute;ndrome.    <br>     c. Validez de Criterio: La escala funciona parecido a otros instrumentos.    <br>     d. Confiabilidad test–retest o interevaluador: La escala funciona bien bajo      diferentes condiciones.    <br>     e. Sensibilidad al Cambio: La escala detecta modificaciones de la realidad      que mide.    ]]></body>
<body><![CDATA[<br>     f. Utilidad: Es una escala f&aacute;cil de aplicar y procesar.</FONT></p> </blockquote>     <p><font size="2" face="Verdana">En el &aacute;rea de la salud existen much&iacute;simos    instrumentos de medici&oacute;n que caben en el concepto de escala. Es l&oacute;gico    que esto sea as&iacute;, dada la complejidad de muchos de los fen&oacute;menos    que se tienen que medir (actitudes, creencias, comportamientos, adaptaci&oacute;n,    autonom&iacute;a, ajuste social, etc.). La mayor&iacute;a de estas escalas ha    sido desarrollada en pa&iacute;ses de habla inglesa, lo cual genera una serie    de inconvenientes cuando se van a utilizar en pa&iacute;ses con lenguajes o    culturas diferentes. El tener que aplicar estas escalas en pacientes de una    cultura diferente de la cultura en la cual se desarroll&oacute;, por parte de    cl&iacute;nicos de una cultura distinta de la de los cl&iacute;nicos con quienes    se cre&oacute; el instrumento y con un ajuste ling&uuml;&iacute;stico que supone    la traducci&oacute;n, implica que se debe repetir el proceso de certificaci&oacute;n    del instrumento, es decir, de validaci&oacute;n de la escala (8).</font></p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana"><b>¿POR QU&Eacute; VALIDAR ESCALAS?</b></font></p>     <p><font size="2" face="Verdana">De acuerdo con los est&aacute;ndares sobre selecci&oacute;n,    construcci&oacute;n y aplicaci&oacute;n de pruebas psicol&oacute;gicas, existen    las siguientes recomendaciones (9):</font></p>     <p><font size="2" face="Verdana">1. Cuando se hacen cambios sustanciales en el    formato del instrumento, modo de aplicaci&oacute;n, idioma o contenido, el usuario    deber&iacute;a revalidar la escala para las nuevas condiciones, o tener argumentos    que apoyen que no es necesaria o posible una validaci&oacute;n adicional.    <br>   2. Cuando se traduce una escala de un idioma    o dialecto a otro, debe establecerse su fiabilidad y validez en los nuevos grupos    ling&uuml;&iacute;sticos en los que se aplique.    <br>   3. Cuando se pretende que las dos versiones    de una escala en idiomas distintos sean comparables, hay que aportar pruebas    de la comparabilidad de los instrumentos.</font></p>     <p><font size="2" face="Verdana">Dadas las anteriores recomendaciones, podr&iacute;a    optarse por realizar una nueva escala en lugar de emprender una validaci&oacute;n.    Sin embargo existe una serie de argumentos que est&aacute;n a favor de la validaci&oacute;n:</font></p>     <p><FONT SIZE="2" face="Verdana"> 1. Puede resultar m&aacute;s econ&oacute;mico    y r&aacute;pido, o sea m&aacute;s eficiente, hacer una validaci&oacute;n que    desarrollar un nuevo instrumento.    ]]></body>
<body><![CDATA[<br>   2. Al utilizarse instrumentos mundialmente aceptados se abre la posibilidad    de efectuar estudios entre diferentes pa&iacute;ses o entre diferentes culturas.    <br>   3. Las escalas con amplia aplicaci&oacute;n cl&iacute;nica suelen ser instrumentos    suficientemente probados.    <br>   4. El desarrollo de una nueva escala implica disponer de recursos t&eacute;cnicos    y humanos altamente calificados y con experiencia en el &aacute;rea.</FONT></p>     <p><FONT size="2" face="Verdana"> Las razones para validar escalas parecen ser    claras, no as&iacute; los m&eacute;todos para hacerlo (10). Existen numerosas    pr&aacute;cticas que se han tomado como validaciones sin serlo: las m&aacute;s    frecuentes son efectuar &uacute;nicamente traducciones, realizar solamente pruebas    de concordancia o correlaci&oacute;n con los resultados de la medici&oacute;n    de otro instrumento, o practicar tan solo pruebas de concordancia entre diferentes    evaluadores. Se debe ser cuidadoso al utilizar un instrumento validado para    fines cl&iacute;nicos o de investigaci&oacute;n, dado el peligro de efectuar    mediciones que no coincidan con la realidad.</FONT></p>     <p>&nbsp;</p>     <p><FONT size="3" face="Verdana"><b>¿CU&Aacute;L ES EL PROCESO DE VALIDACI&Oacute;N    DE UNA ESCALA?</b></FONT></p>     <p><FONT size="2" face="Verdana"> La validaci&oacute;n de una escala es un proceso    complejo, que comprende varias etapas y que requiere un n&uacute;mero elevado    de pacientes. Supone adem&aacute;s disponer de herramientas estad&iacute;sticas    para efectuar procedimientos que pueden resultar complejos. En general, el proceso    de validaci&oacute;n de una escala debe tener las siguientes etapas:</font></p>     <p><FONT size="2" face="Verdana">Selecci&oacute;n de la Escala    <br>   Traducci&oacute;n    <br>   Pruebas Preliminares para realizar ajustes (de &iacute;tems y utilidad)    ]]></body>
<body><![CDATA[<br>   Pruebas de su Validez    <br>   Pruebas de su Confiabilidad    <br>   Determinaci&oacute;n de su Utilidad</FONT></p>     <p><FONT size="2" face="Verdana"> 1. Selecci&oacute;n de la escala</font></p>     <p><FONT SIZE="2" face="Verdana">Aunque este paso parezca obvio, es importante    resaltar su importancia. La escala que se va a validar debe ser la mejor disponible.    Saber esto implica efectuar una cuidadosa revisi&oacute;n sistem&aacute;tica    de la literatura disponible sobre el tema y eventualmente efectuar una consulta    a expertos en el &aacute;rea sobre la que se efectuar&aacute; la medici&oacute;n.    En el reporte de validaci&oacute;n de una escala debe quedar suficientemente    fundamentado por qu&eacute; se seleccion&oacute; esa escala para ser validada.</font></p>     <p><FONT size="2" face="Verdana"> 2. Traducci&oacute;n</font></p>     <p><font size="2" face="Verdana">Cuando la escala original se encuentre en otro    idioma, debe someterse a un proceso de traducci&oacute;n. Este proceso debe    hacerse con cuidado ya que puede introducir distorsiones en la escala y por    lo tanto generar errores de medici&oacute;n (11).</font></p>     <p><font size="2" face="Verdana"> El &eacute;nfasis del proceso no es la traducci&oacute;n    textual o literal, sino la traducci&oacute;n del sentido conceptual que cada    &iacute;tem persigue.</font></p>     <p><font size="2" face="Verdana"> El primer paso en el proceso de traducci&oacute;n    es conformar un comit&eacute; de revisi&oacute;n; este comit&eacute; estar&aacute;    compuesto por miembros del grupo encargado de la revisi&oacute;n (al menos dos    personas), por una o dos personas con experiencia en el &aacute;rea de aplicaci&oacute;n    del instrumento y conocimiento del idioma original de la escala y por uno o    dos sujetos que hayan presentado o que presenten la condici&oacute;n que busca    medir el instrumento. Antes de buscar traductores, el comit&eacute; de revisi&oacute;n    debe prever dificultades que puedan surgir en la traducci&oacute;n o validaci&oacute;n:    por ejemplo, si en una escala que se va a aplicar en pacientes colombianos se    incluye un &iacute;tem que explora la afici&oacute;n por el jockey sobre hielo,    se puede sugerir que se explore mejor la afici&oacute;n por el f&uacute;tbol.    Una vez definido este punto, el instrumento es enviado a los traductores. El    n&uacute;mero de traductores requerido no es tan importante como la calidad    de los mismos. En general se recomienda buscar traductores con las siguientes    caracter&iacute;sticas (12):</font></p>     <blockquote>        ]]></body>
<body><![CDATA[<p><FONT size="2" face="Verdana">a. Ser competentes en los idiomas implicados      (biling&uuml;ismo).    <br>     b. Conocer, ser parte o estar inmerso en la cultura en la cual se aplicar&aacute;      la escala validada.    <br>     c. Tener un entrenamiento b&aacute;sico sobre medici&oacute;n en salud o comportamiento.    <br>     d. Tener un m&iacute;nimo entrenamiento en construcci&oacute;n de instrumentos      de medici&oacute;n y <I>"tests"</I>.</FONT></p> </blockquote>     <p><font size="2" face="Verdana">Para cumplir las dos &uacute;ltimas caracter&iacute;sticas    se puede efectuar una capacitaci&oacute;n sobre estos temas a los traductores    que participen en el proceso. La traducci&oacute;n del idioma original al idioma    de aplicaci&oacute;n se denomina traducci&oacute;n directa; la traducci&oacute;n    en el otro sentido se llama traducci&oacute;n inversa.</font></p>     <p><font size="2" face="Verdana">Existen diferentes estrategias para garantizar    una traducci&oacute;n de la mejor calidad (13). Una de las m&aacute;s pr&aacute;cticas    y sencillas recomienda disponer de por lo menos dos traducciones directas efectuadas    por diferentes individuos (traductor A y traductor B). Si se encuentran diferencias    importantes en el significado de algunos de los &iacute;tems, debe solicitarse    a los traductores que en conjunto, lleguen a un acuerdo sobre los puntos discordantes.    Si esto no es posible debe recurrirse a un tercer traductor. Dependiendo de    las caracter&iacute;sticas del instrumento, despu&eacute;s de un tiempo en el    cual se garantice que los traductores no recuerden el contenido de la escala    que tradujeron previamente (al menos una semana), se entrega la versi&oacute;n    del traductor A al B y la del B al A para que efect&uacute;en una traducci&oacute;n    inversa. Entonces el comit&eacute; de revisi&oacute;n evaluar&aacute; si el    significado de los &iacute;tems re-traducidos coincide con los de la escala    original.</font></p>     <p><font size="2" face="Verdana">Otra alternativa es entregar la versi&oacute;n    traducida a un tercer evaluador que hasta ahora no haya participado en el proceso    y que se encargar&aacute; de efectuar la traducci&oacute;n inversa. Con estos    insumos el comit&eacute; de revisi&oacute;n establecer&aacute; una versi&oacute;n    traducida del instrumento.</font></p>     <p><font size="2" face="Verdana">3. Prueba preliminar para ajuste</font></p>     <p><FONT SIZE="2" face="Verdana">La versi&oacute;n traducida que se defini&oacute;    en la fase previa se aplicar&aacute; a un grupo de pacientes (entre 10 y 15)    por parte de dos o tres evaluadores diferentes. Tanto los pacientes como los    evaluadores deber&aacute;n tener caracter&iacute;sticas similares a las del    escenario de aplicaci&oacute;n final de la escala. En esta fase se analizan    aspectos relacionados con particularidades de los rubros y con la utilidad de    la escala (14).</font></p>     <p><FONT size="2" face="Verdana"> a. En relaci&oacute;n con las particularidades    de los rubros se debe tener en cuenta:</font></p>     ]]></body>
<body><![CDATA[<p><FONT size="2" face="Verdana">- Grado de comprensi&oacute;n de los rubros:    Como las escalas buscan medir condiciones presentes independientemente del nivel    educativo de los pacientes, los rubros deben estar escritos en un lenguaje sencillo,    f&aacute;cilmente comprensible para todos, evitando t&eacute;rminos t&eacute;cnicos    o de uso poco frecuente.    <br>   - Ambig&uuml;edad: Deben evitarse t&eacute;rminos que puedan ser interpretados    de distintas maneras. Por ejemplo, en la pregunta: "¿se ha sentido usted deprimido    &uacute;ltimamente?", el t&eacute;rmino "&uacute;ltimamente" puede interpretarse    de diferentes maneras (en el &uacute;ltimo a&ntilde;o, en el &uacute;ltimo mes,    despu&eacute;s de alg&uacute;n acontecimiento particular, etc) lo cual genera    errores en la medici&oacute;n.    <br>   &Iacute;tem con carga afectiva: La utilizaci&oacute;n de ciertos adjetivos puede    generar errores de medici&oacute;n al inducir alg&uacute;n tipo particular de    respuesta. Por ejemplo: "¿Se siente molesto por las <I>rid&iacute;culas</I>    equivocaciones de su m&eacute;dico?".    <br>   - Frecuencia de respuesta: Si m&aacute;s del 95% de los individuos a quienes    se aplica la prueba preliminar para ajuste califican igual un &iacute;tem, debe    considerarse la posibilidad de excluirlo de la escala, dada la posibilidad de    que no est&eacute; aportando variabilidad al instrumento. Dependiendo de las    caracter&iacute;sticas de la escala, una conducta adecuada es poner este &iacute;tem    "bajo observaci&oacute;n" y analizar posteriormente las escasas respuestas no    coincidentes, dada la posibilidad que correspondan a errores en la medici&oacute;n.    <br>   - Restricci&oacute;n de Rango de Respuesta: Si un &iacute;tem puede responderse    dentro de las cuatro opciones "bueno–regular–malo–muy malo", y ninguno de los    individuos utiliza la opci&oacute;n "muy malo", puede pensarse en eliminar esta    opci&oacute;n de medici&oacute;n del &iacute;tem y dejarlo solo con tres niveles.</FONT></p>     <p><FONT size="2" face="Verdana"> b. En relaci&oacute;n con la utilidad de la    escala deben evaluarse aspectos como:</font></p>     <p><FONT size="2" face="Verdana">- El tiempo de diligenciamiento y aplicaci&oacute;n    requerido: Entre menos tiempo se demore en efectuar la medici&oacute;n bien    hecha, mejor.    <br>   - Necesidad de entrenamiento: Entre menos entrenamiento especial se requiera    para aplicar la escala &eacute;sta ser&aacute; m&aacute;s f&aacute;cil de aplicar    en condiciones reales.    <br>   - Caracter&iacute;sticas del formato del instrumento: Entre m&aacute;s corto    el instrumento es m&aacute;s f&aacute;cil de tramitar. En los textos largos    se recomiendan tipos de letra que permitan una f&aacute;cil lectura, como los    que tienen <I>serifs</I>. Puede ser necesario incluir un corto instructivo al    inicio de la escala.    <br>   - Facilidad para calificar el puntaje final de la escala: Los &iacute;tem que    tienen diferente ponderaci&oacute;n o los procedimientos que suponen algoritmos    complicados para calificar la escala deber&iacute;an evitarse.</font></p>     ]]></body>
<body><![CDATA[<p><FONT size="2" face="Verdana">4. Pruebas de Validez</FONT></p>     <p><FONT size="2" face="Verdana">La evaluaci&oacute;n de la validez de una escala    busca responder a las siguientes preguntas:</FONT></p>     <p><FONT size="2" face="Verdana"> a. ¿La escala parece medir lo que debe medir?    <I>Validez de apariencia</I>:    <br>   Responder a esta pregunta tiene importancia para determinar la aceptabilidad    que puede tener la escala en el escenario de aplicaci&oacute;n (15). Para establecer    la validez de apariencia se deben conformar dos grupos, uno de sujetos que van    a ser medidos con la escala y otro de expertos: ellos analizan la escala y dictaminan    si &eacute;sta realmente parece medir lo que se propone. Esta validez no supone    un concepto estad&iacute;stico, sino que depende de los juicios que los expertos    hagan sobre la pertinencia de los &iacute;tems. Cada uno de los grupos puede    estar conformado por cuatro o cinco personas.    <br>   b. ¿Refleja la estructura de dominios del s&iacute;ndrome? <I>Validez de Contenido</I>:    <br>   La respuesta de esta pregunta supone evaluar si los diferentes &iacute;tems    incluidos en el instrumento representan adecuadamente los dominios o factores    del concepto que se pretende medir. El procedimiento para evaluar la validez    de contenido supone aplicar m&eacute;todos estad&iacute;sticos como el an&aacute;lisis    factorial (16). La ventaja de estos m&eacute;todos es que permiten saber, no    solo cu&aacute;l es la estructura factorial, sino c&oacute;mo representan los    &iacute;tems los distintos factores, y eventualmente retirar &iacute;tem que    no aportan variabilidad a la medici&oacute;n del s&iacute;ndrome. Para efectuar    este tipo de an&aacute;lisis se requieren por lo menos cinco pacientes por cada    &iacute;tem que tenga el instrumento, pero no menos de 100 pacientes en total    (17).</FONT></p>     <p><FONT size="2" face="Verdana">Todos los pacientes deben presentar la condici&oacute;n    que la escala pretende medir, incluyendo los diferentes espectros de intensidad.    Una vez determinados cu&aacute;les son los diferentes factores que mide la escala,    puede recurrirse a otros instrumentos que midan esos factores para efectuar    una comparaci&oacute;n: a esto se le denomina <I>Validez de Constructo</I>.    Por ejemplo, si el an&aacute;lisis factorial en una validaci&oacute;n de una    escala muestra un dominio denominado Depresi&oacute;n, puede aplicarse simult&aacute;neamente    una escala reconocida para medir depresi&oacute;n y contrastar su resultado    con el de la escala que se est&aacute; validando. Otra estrategia reconocida    para medir la validez de constructo es mediante la evaluaci&oacute;n de los    valores de correlaci&oacute;n en estructuras matriciales (Matriz multirrasgo    – multim&eacute;todo (18)).</FONT></p>     <p><FONT size="2" face="Verdana"> c. ¿Funciona de manera similar a otros instrumentos    certificados? <I>Validez de criterio (concurrente y predictiva)</I> (19):    <br>   Para saber esto debe compararse la escala que se est&aacute; validando, con    un patr&oacute;n de oro que deber&iacute;a ser la mejor escala disponible en    el &aacute;rea de aplicaci&oacute;n cl&iacute;nica: en este caso se habla de    <I>validez de criterio concurrente</I>. Estad&iacute;sticamente la comparaci&oacute;n    se efect&uacute;a mediante coeficientes de correlaci&oacute;n de <I>Pearson</I>    o de <I>Spearman</I>, dependiendo de las caracter&iacute;sticas de distribuci&oacute;n    de los datos. Por supuesto, la comparaci&oacute;n debe hacerse con un instrumento    ya validado. En caso de que no haya m&aacute;s instrumentos validados la comparaci&oacute;n    suele efectuarse con m&eacute;todos de apreciaci&oacute;n cl&iacute;nica subjetiva    (como la impresi&oacute;n cl&iacute;nica global), pero reconociendo que los    valores de correlaci&oacute;n con este tipo de instrumentos no suelen ser muy    altos, lo cual no quiere decir que la escala funcione mal. Para obviar este    inconveniente, una alternativa es efectuar validaci&oacute;n simult&aacute;nea    de dos instrumentos que eval&uacute;en la misma condici&oacute;n. Esta alternativa    tiene la ventaja de que reporta valores de correlaci&oacute;n m&aacute;s consistentes    y que permite aprovechar una misma muestra de pacientes para el procedimiento    de validaci&oacute;n. Los valores de correlaci&oacute;n deben estar preferiblemente    por encima de 0.8. El hallazgo de valores altos de correlaci&oacute;n entre    las escalas en proceso paralelo de validaci&oacute;n debe interpretarse con    cautela.</font></p>     <p><FONT size="2" face="Verdana">Cuando quiera que se eval&uacute;e la correlaci&oacute;n    o concordancia entre el resultado actual del instrumento y un evento relacionado    que puede suceder en el futuro, el procedimiento recibe el nombre de <I>validez    de criterio predictivo (validez predictiva)</I>. Un ejemplo es la evaluaci&oacute;n    de un estudiante universitario con"criterios ideales de excelencia" antes de    iniciar su entrenamiento y compararlo con las notas que ese estudiante vaya    a obtener en el futuro o al finalizar su carrera.</font></p>     ]]></body>
<body><![CDATA[<p><FONT size="2" face="Verdana">d. Cuando la condici&oacute;n que se est&aacute;    midiendo cambia, puede la escala medir ese cambio?: <I>Sensibilidad al cambio</I>.    <br>   Medir la sensibilidad al cambio es de particular importancia cuando se trata    de instrumentos dise&ntilde;ados, no tanto para diagnosticar, sino para cuantificar    atributos, lo cual nos asegura que la escala es buena para medir una condici&oacute;n    a lo largo del tiempo. Este tipo de escalas son las que nos permiten evaluar    la respuesta a un tratamiento. El procedimiento m&aacute;s usado para evaluar    la sensibilidad al cambio consiste en comparar una puntuaci&oacute;n inicial    con una puntuaci&oacute;n posterior, en un momento en el cual se haya modificado    la condici&oacute;n cl&iacute;nica (20). La documentaci&oacute;n de este cambio    suele hacerse aplicando otras escalas o simplemente una evaluaci&oacute;n cl&iacute;nica    global. Los m&eacute;todos estad&iacute;sticos empleados dependen de las caracter&iacute;sticas    distribucionales de los puntajes de la escala, aunque usualmente son &uacute;tiles    los An&aacute;lisis de Varianza para Mediciones Repetidas.</FONT></p>     <p><FONT size="2" face="Verdana">5. Pruebas de confiabilidad</font></p>     <p><FONT size="2" face="Verdana">Como se mencion&oacute; antes, la confiabilidad    hace referencia a si la escala funciona de manera similar bajo diferentes condiciones,    dependientes del mismo instrumento, del tiempo de aplicaci&oacute;n y del cl&iacute;nico    que hace la medici&oacute;n. Se puede decir que la confiabilidad es una medici&oacute;n    del error que puede generar un instrumento al ser inestable y aplicarse en diferentes    condiciones. Debe evaluarse la confiabilidad en tres aspectos:</FONT></p>     <p><FONT size="2" face="Verdana"> a. Relacionados con el instrumento:    <br>   Si los &iacute;tems que conforman la escala, tienen unos adecuados niveles de    correlaci&oacute;n entre ellos, conforman una estructura "aglutinada" que le    confiere cierta estabilidad al instrumento. Las correlaciones entre &iacute;tem    con &iacute;tem, entre &iacute;tem y factor y entre &iacute;tem y escala son    una especie de pegante que le confiere al instrumento lo que se denomina <I>consistencia    Interna</I> u <I>homogeneidad</I>. La medici&oacute;n de esta consistencia se    realiza mediante diferentes procedimientos pero los m&aacute;s usados son el    coeficiente KR-20 (f&oacute;rmula 20 de Kuder–Richardson) y especialmente el    alfa de Cronbach (21). El primero de estos instrumentos se usa cuando los &iacute;tems    son de respuesta dicot&oacute;mica. El alfa de Cronbach permite evaluar homogeneidad    en escalas cuyos &iacute;tems pueden responderse en m&aacute;s de dos alternativas.</font></p>     <p><FONT size="2" face="Verdana">Al evaluar los resultados de estos coeficientes    debe tenerse en cuenta que sus valores se afectan por el n&uacute;mero de &iacute;tem    en la escala; seg&uacute;n esto, al aumentar el n&uacute;mero de &iacute;tem    del instrumento el valor del coeficiente alfa se incrementa artificialmente.    Los valores que se recomiendan para estos &iacute;ndices son entre 0.7 y 0.9    (70% a 90%). Valores bajos sugieren que la escala es poco homog&eacute;nea,    que puede estar evaluando diferentes fen&oacute;menos y que no muestra consistencia    ante diferentes condiciones de aplicaci&oacute;n; valores mayores de 0.9 sugieren    una estructura demasiado homog&eacute;nea, en la cual probablemente existan    &iacute;tem redundantes. Los diferentes programas estad&iacute;sticos existentes,    como SPSS&reg;, SAS&reg;, NCSS&reg; y STATA&reg;, por citar algunos, efect&uacute;an    el c&aacute;lculo de estos coeficientes.</FONT></p>     <p><FONT size="2" face="Verdana">b. Relacionados con el tiempo de aplicaci&oacute;n:    <br>   Se debe medir si la escala, cuando se aplica en diferentes momentos, permaneciendo    estable la condici&oacute;n que se mide, mantiene un resultado similar en la    medici&oacute;n. Esto es lo que se ha denominado <I>confiabilidad test – retest</I>.    Para medir este tipo de confiabilidad se aplica la escala por lo menos dos veces,    en diferentes momentos, en situaciones de estabilidad del fen&oacute;meno o    s&iacute;ndrome que se est&aacute; midiendo. La medici&oacute;n de este tipo    de confiabildad se ha efectuado mediante diferentes procedimientos:</font></p>     <p><FONT size="2" face="Verdana">- Coeficiente de correlaci&oacute;n de Pearson:    Eval&uacute;a c&oacute;mo se relacionan los puntajes de los diferentes momentos,    en t&eacute;rminos de asociaci&oacute;n lineal. Es un m&eacute;todo poco utilizado    ya que no incorpora en el an&aacute;lisis otras fuentes de variabilidad, al    asumir que toda la varianza es explicada por las diferencias entre los sujetos    medidos.</FONT></p>     ]]></body>
<body><![CDATA[<p><FONT size="2" face="Verdana">- Coeficiente de correlaci&oacute;n intraclase:    Es una medida de confiabilidad mejor que la anterior ya que incorpora en el    an&aacute;lisis, adem&aacute;s de la variabilidad entre los sujetos, otras fuentes    de variabilidad como pueden ser diferentes observadores, caracter&iacute;sticas    de los pacientes (tambi&eacute;n llamada variabilidad dentro de los sujetos)    y error. Se puede calcular a trav&eacute;s de un procedimiento estad&iacute;stico    denominado An&aacute;lisis de Varianza de Mediciones Repetidas (ANOVA de medidas    repetidas). El resultado del coeficiente se interpreta como el porcentaje de    la variabilidad de los puntajes que depende solo se la variabilidad entre los    sujetos medidos. Por ejemplo, si el valor es 0.9 esto indica que el 90% de la    varianza de los puntajes depende solo de la variabilidad de los sujetos. Una    adecuada confiabilidad test – retest est&aacute; indicada por valores mayores    de 0.8.</FONT></p>     <p><FONT size="2" face="Verdana">- Coeficiente de correlaci&oacute;n–concordancia    de Lin (22): Este coeficiente se basa en la premisa de que el caso ideal de    correlaci&oacute;n se da cuando el dispersograma que originan dos mediciones    se ve como una recta con una inclinaci&oacute;n de 45 grados. Los coeficientes    tradicionales no pueden detectar esta situaci&oacute;n ideal, por lo cual, as&iacute;    reporten valores elevados, no necesariamente est&aacute;n reflejando la concordancia    entre las dos mediciones. El coeficiente de Lin compara el acuerdo entre dos    pares de mediciones midiendo la variaci&oacute;n alrededor de una l&iacute;nea    de 45º que parte del origen. Se recomienda usar esta medida como complemento    del coeficiente de correlaci&oacute;n intraclase.</FONT></p>     <p><FONT size="2" face="Verdana"> c. Relacionados con la aplicaci&oacute;n por    diferentes personas:    <br>   Si en el mismo momento, ante el mismo paciente, la escala es aplicada por diferentes    observadores, los resultados de la medici&oacute;n deber&iacute;an ser similares.    Esto es lo que se mide con la Confiabilidad interevaluador. Obviamente, los    evaluadores deber&aacute;n tener un entrenamiento similar o una capacitaci&oacute;n    uniforme para aplicaci&oacute;n el instrumento. De otra manera, los puntajes    diferentes estar&aacute;n reflejando, no debilidades de la escala, sino una    fuente de variabilidad adicional introducida por quienes efect&uacute;an la    medici&oacute;n.</font></p>     <p><FONT size="2" face="Verdana">El tama&ntilde;o de muestra requerido para la    estimaci&oacute;n de estos diferentes coeficientes depender&aacute; del valor    estimado de correlaci&oacute;n, del n&uacute;mero de observadores y del nivel    de significaci&oacute;n establecido (23).</FONT></p>     <p><FONT size="2" face="Verdana"> 6. Determinaci&oacute;n de la utilidad</font></p>     <p><FONT size="2" face="Verdana">Este punto hace referencia a la aplicabilidad    del instrumento en el escenario real. Si bien, no depende de la aplicaci&oacute;n    de procedimientos estad&iacute;sticos, en la validaci&oacute;n de una escala    debe describirse el tiempo promedio requerido para aplicar el instrumento, la    necesidad de condiciones particulares en las cuales haya que poner al sujeto    antes de iniciar el procedimiento, el grado de capacitaci&oacute;n o calificaci&oacute;n    profesional que requieren quienes se encargar&aacute;n de aplicar el instrumento,    y la forma, m&eacute;todo y tiempo requerido para calificar el puntaje de la    escala.</font></p>     <p>&nbsp;</p>     <p><FONT size="3" face="Verdana"><b>¿C&Oacute;MO LEER CR&Iacute;TICAMENTE UN ART&Iacute;CULO    RELACIONADO CON VALIDACI&Oacute;N DE ESCALAS?</b></font></p>     <p><font size="2" face="Verdana">Como cada vez hay una mayor tendencia a efectuar    validaciones de escalas en nuestro medio, presentamos la siguiente lista de    chequeo para facilitar el proceso de an&aacute;lisis y evaluaci&oacute;n de    los art&iacute;culos y publicaciones relacionadas con estos procedimientos:</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana">Lista de chequeo para evaluar la calidad de la    validaci&oacute;n de una escala:</font></p>     <p><FONT size="2" face="Verdana"><img src="/img/revistas/rsap/v6n3/a06img01.gif">    Item</FONT></p>     <p><font size="2" face="Verdana">¿De d&oacute;nde vienen?:</font></p>     <p><font size="2" face="Verdana">• De escalas previas.    <br>   • De observaci&oacute;n cl&iacute;nica.    <br>   • De opini&oacute;n de expertos.    <br>   • De reporte de pacientes.    <br>   • De hallazgos de investigaci&oacute;n.    <br>   • De supuestos te&oacute;ricos.</font></p>     <p><font size="2" face="Verdana"> Se midi&oacute; en ellos:</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana"> • Frecuencia de respuesta    <br>   • Restricci&oacute;n en el rango    <br>   • Comprensi&oacute;n    <br>   • Ambig&uuml;edad    <br>   • Carga afectiva</font></p>     <p><FONT size="2" face="Verdana"><img src="/img/revistas/rsap/v6n3/a06img01.gif">    Validez:</FONT></p>     <p><font size="2" face="Verdana"> - ¿Tiene validez de apariencia?    <br>   - ¿Hay evidencia de la validez de contenido?    <br>   - ¿Hay evidencia de la validez de constructo?    <br>   - ¿Se evalu&oacute; validez de criterio? ¿De manera concurrente? ¿De manera    predictiva?</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana">- ¿En qu&eacute; grupos se evalu&oacute; la validez?    &nbsp;</font></p>     <p><FONT size="2" face="Verdana"><img src="/img/revistas/rsap/v6n3/a06img01.gif">    Confiabilidad:</FONT></p>     <p><font size="2" face="Verdana"> – ¿Se evalu&oacute; consistencia interna?    <br>   – ¿Tiene buena confiabilidad test-retest?    <br>   – ¿Y confiabilidad interevaluador?    <br>   – ¿En qu&eacute; grupos se midi&oacute; confiabilidad?    <br>   – ¿C&oacute;mo se calcul&oacute; la confiabilidad?</font></p>     <p><FONT size="2" face="Verdana"><img src="/img/revistas/rsap/v6n3/a06img01.gif">    Utilidad:</FONT></p>     <p><font size="2" face="Verdana"> – ¿Se puede aplicar en un tiempo razonable?    <br>   – ¿Qu&eacute; tanto entrenamiento se requiere?    ]]></body>
<body><![CDATA[<br>   – ¿Es f&aacute;cil de calificar?</font></p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana"><b> REFERENCIAS</b></font></p>     <!-- ref --><p><FONT SIZE="2" face="Verdana"> 1. Leach DC. Changing education to improve patient    care. Quality in Health Care 2001; 10 (supp II):ii54-ii58.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000186&pid=S0124-0064200400030000600001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 2. Echeverry J. Definiendo Enfermedad. Rev Col    Neumol 2003;15(2):69-81</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000187&pid=S0124-0064200400030000600002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 3. Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic    Research. Principles and Quantitative Methods. New York: Van Nostrand Reinhold;    1982.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000188&pid=S0124-0064200400030000600003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 4. McDowell I, Newell C. The Theoretical and    technical Foundations of Health Measurement. In: Measuring Health. 2nd edition.    New York: Oxford University Press; 1996. p. 10-46.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000189&pid=S0124-0064200400030000600004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 5. DeVellis RF. Scale Development. Theory and    Applications. Newbury Park: Sage Publications; 1991.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000190&pid=S0124-0064200400030000600005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 6. S&aacute;nchez R, G&oacute;mez C. Conceptos    b&aacute;sicos sobre validaci&oacute;n de escalas. Revista Colombiana de Psiquiatr&iacute;a.    1998; 27:121-130.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000191&pid=S0124-0064200400030000600006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 7. Guyatt GH, Kirshner B, Jaeschke R. Measuring    Health Status: GAT is the Necessary Measurement Properties? J Clin Epidemiol.    1992; 45:1341-1345.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000192&pid=S0124-0064200400030000600007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 8. Guillemin F, Bombardier C, Beaton D. Cross    – Cultural Adaptation of Life Measures: Literature Review and Proposed Guidelines.    J Clin Epidemiol. 1993;46:1417-1432.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000193&pid=S0124-0064200400030000600008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana"> 9. American Psychological Association. Standards    for Educational and Psychological tests. Washington: Author; 1985.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000194&pid=S0124-0064200400030000600009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">10. Hambleton RK. Guidelines for adapting educational    and psychological tests: A progress report. Eur J Psych Assess 1994; 10: 229-240.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000195&pid=S0124-0064200400030000600010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">11. Berkanovic E. The Effect of Inadecuate Language    Translation on Hispanic Responses on Health Surveys. Am J of Public Health 1980;70:1273-1276.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000196&pid=S0124-0064200400030000600011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">12. Hambleton RK. Adaptaci&oacute;n de Tests    para Uso en Diferentes Idiomas y Culturas: Fuentes de Error, Posibles Soluciones    y Directrices Pr&aacute;cticas. En: Mu&ntilde;iz J. Psicometr&iacute;a. Madrid:    Editorial Universitas, S. A; 1996. p. 207-238.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000197&pid=S0124-0064200400030000600012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">13. Prieto AJ. A Method for Translation of Instruments    to other Languages. Adult Education Quarterly 1992; 43:1-14.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000198&pid=S0124-0064200400030000600013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">14. Streiner DL. A Checklist for Evaluating the    Usefulness of Rating Scales. Can J Psychiatry 1993; 38:140-148.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000199&pid=S0124-0064200400030000600014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">15. Feinstein A. Clinimetrics. Yale University    Press; 1987.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000200&pid=S0124-0064200400030000600015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">16. Nunally JC. Psychometric theory. New York:    McGraw Hill: 1978.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000201&pid=S0124-0064200400030000600016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">17. Norman GR, Streiner DL. Componentes Principales    y An&aacute;lisis de Factores. En: Norman GR, Streiner DL. Bioestad&iacute;stica.    Madrid : Mosby-Doyma Libros; 1996. p. 129-142.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000202&pid=S0124-0064200400030000600017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">18. Campbell DT, Fiske AW. Convergent and Discriminant    Valdation by Multitrait-multimethod matrix. Psychological Bulletin 1959;56:81-105.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000203&pid=S0124-0064200400030000600018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">19. Streiner D, Norman GR. Health Measurement    Scales. A Practical Guide to their Development and Use. 2nd ed. Oxford: Oxford    University Press; 1995.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000204&pid=S0124-0064200400030000600019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">20. Guyatt HG, Walter S, Norman G. Measuring    Change Over Time: Assessing the usefulness of Evaluative Instruments. J Chronic    Dis 1987; 40:171-178.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000205&pid=S0124-0064200400030000600020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">21. Cronbach LJ. Coefficient alpha and the internal    structure of tests. Psychometrika 1951;16:297-334.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000206&pid=S0124-0064200400030000600021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">22. Lin L. I-K.. A concordance correlation coefficient    to evaluate reproducibility. Biometrics 1989; 45: 255-68.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000207&pid=S0124-0064200400030000600022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><FONT SIZE="2" face="Verdana">23. Donner A, Eliasziw M. Sample Size Requirements    for Reliability Studies. Statistics in Medicine 1987; 441-448.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000208&pid=S0124-0064200400030000600023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="2" face="Verdana">Recibido 30 Junio 2004/Enviado para Modificaci&oacute;n    12 Julio 2004/Aceptado 26 Agosto 2004</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Leach]]></surname>
<given-names><![CDATA[DC.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Changing education to improve patient care]]></article-title>
<source><![CDATA[Quality in Health Care]]></source>
<year>2001</year>
<volume>10</volume>
<numero>^sII</numero>
<issue>^sII</issue>
<supplement>II</supplement>
<page-range>ii54-ii58</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Echeverry]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Definiendo Enfermedad]]></article-title>
<source><![CDATA[Rev Col Neumol]]></source>
<year>2003</year>
<volume>15</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>69-81</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kleinbaum]]></surname>
<given-names><![CDATA[DG]]></given-names>
</name>
<name>
<surname><![CDATA[Kupper]]></surname>
<given-names><![CDATA[LL]]></given-names>
</name>
<name>
<surname><![CDATA[Morgenstern]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Epidemiologic Research. Principles and Quantitative Methods]]></source>
<year>1982</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Van Nostrand Reinhold]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McDowell]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Newell]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Theoretical and technical Foundations of Health Measurement]]></article-title>
<source><![CDATA[Measuring Health]]></source>
<year>1996</year>
<edition>2</edition>
<page-range>10-46</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DeVellis]]></surname>
<given-names><![CDATA[RF]]></given-names>
</name>
</person-group>
<source><![CDATA[Scale Development. Theory and Applications]]></source>
<year>1991</year>
<publisher-loc><![CDATA[Newbury Park ]]></publisher-loc>
<publisher-name><![CDATA[Sage Publications]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sánchez]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Conceptos básicos sobre validación de escalas]]></article-title>
<source><![CDATA[Revista Colombiana de Psiquiatría]]></source>
<year>1998</year>
<volume>27</volume>
<page-range>121-130</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guyatt]]></surname>
<given-names><![CDATA[GH]]></given-names>
</name>
<name>
<surname><![CDATA[Kirshner]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Jaeschke]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Measuring Health Status: GAT is the Necessary Measurement Properties?]]></article-title>
<source><![CDATA[J Clin Epidemiol.]]></source>
<year>1992</year>
<volume>45</volume>
<page-range>1341-1345</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guillemin]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Bombardier]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Beaton]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Cross - Cultural Adaptation of Life Measures: Literature Review and Proposed Guidelines]]></article-title>
<source><![CDATA[J Clin Epidemiol.]]></source>
<year>1993</year>
<volume>46</volume>
<page-range>1417-1432</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="">
<collab>American Psychological Association</collab>
<source><![CDATA[Standards for Educational and Psychological tests]]></source>
<year>1985</year>
<publisher-loc><![CDATA[Washington ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hambleton]]></surname>
<given-names><![CDATA[RK]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Guidelines for adapting educational and psychological tests: A progress report]]></article-title>
<source><![CDATA[Eur J Psych Assess]]></source>
<year>1994</year>
<volume>10</volume>
<page-range>229-240</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Berkanovic]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Effect of Inadecuate Language Translation on Hispanic Responses on Health Surveys]]></article-title>
<source><![CDATA[Am J of Public Health]]></source>
<year>1980</year>
<volume>70</volume>
<page-range>1273-1276</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hambleton]]></surname>
<given-names><![CDATA[RK]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Adaptación de Tests para Uso en Diferentes Idiomas y Culturas: Fuentes de Error, Posibles Soluciones y Directrices Prácticas]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Muñiz]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Psicometría]]></source>
<year>1996</year>
<page-range>207-238</page-range><publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Universitas, S. A]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Prieto]]></surname>
<given-names><![CDATA[AJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Method for Translation of Instruments to other Languages]]></article-title>
<source><![CDATA[Adult Education Quarterly]]></source>
<year>1992</year>
<volume>43</volume>
<page-range>1-14</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Streiner]]></surname>
<given-names><![CDATA[DL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Checklist for Evaluating the Usefulness of Rating Scales]]></article-title>
<source><![CDATA[Can J Psychiatry]]></source>
<year>1993</year>
<volume>38</volume>
<page-range>140-148</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Feinstein]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Clinimetrics]]></source>
<year>1987</year>
<publisher-name><![CDATA[Yale University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nunally]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
</person-group>
<source><![CDATA[Psychometric theory]]></source>
<year>1978</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw Hill]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Norman]]></surname>
<given-names><![CDATA[GR]]></given-names>
</name>
<name>
<surname><![CDATA[Streiner]]></surname>
<given-names><![CDATA[DL]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Componentes Principales y Análisis de Factores]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Norman]]></surname>
<given-names><![CDATA[GR]]></given-names>
</name>
<name>
<surname><![CDATA[Streiner]]></surname>
<given-names><![CDATA[DL]]></given-names>
</name>
</person-group>
<source><![CDATA[Bioestadística]]></source>
<year>1996</year>
<page-range>129-142</page-range><publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Mosby-Doyma Libros]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Campbell]]></surname>
<given-names><![CDATA[DT]]></given-names>
</name>
<name>
<surname><![CDATA[Fiske]]></surname>
<given-names><![CDATA[AW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Convergent and Discriminant Valdation by Multitrait-multimethod matrix]]></article-title>
<source><![CDATA[Psychological Bulletin]]></source>
<year>1959</year>
<volume>56</volume>
<page-range>81-105</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Streiner]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Norman]]></surname>
<given-names><![CDATA[GR]]></given-names>
</name>
</person-group>
<source><![CDATA[Health Measurement Scales. A Practical Guide to their Development and Use]]></source>
<year>1995</year>
<edition>2</edition>
<publisher-loc><![CDATA[Oxford ]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guyatt]]></surname>
<given-names><![CDATA[HG]]></given-names>
</name>
<name>
<surname><![CDATA[Walter]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Norman]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Measuring Change Over Time: Assessing the usefulness of Evaluative Instruments]]></article-title>
<source><![CDATA[J Chronic Dis]]></source>
<year>1987</year>
<volume>40</volume>
<page-range>171-178</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cronbach]]></surname>
<given-names><![CDATA[LJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Coefficient alpha and the internal structure of tests]]></article-title>
<source><![CDATA[Psychometrika]]></source>
<year>1951</year>
<volume>16</volume>
<page-range>297-334</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lin]]></surname>
<given-names><![CDATA[L. I-K.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A concordance correlation coefficient to evaluate reproducibility]]></article-title>
<source><![CDATA[Biometrics]]></source>
<year>1989</year>
<volume>45</volume>
<page-range>255-68</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Donner]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Eliasziw]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Sample Size Requirements for Reliability Studies]]></source>
<year></year>
<page-range>441-448</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
