<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0034-7450</journal-id>
<journal-title><![CDATA[Revista Colombiana de Psiquiatría]]></journal-title>
<abbrev-journal-title><![CDATA[rev.colomb.psiquiatr.]]></abbrev-journal-title>
<issn>0034-7450</issn>
<publisher>
<publisher-name><![CDATA[Asociacion Colombiana de Psiquiatria.]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0034-74502007000200013</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Validez en la evaluación de escalas]]></article-title>
<article-title xml:lang="en"><![CDATA[Validity in Scale-testing]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Lamprea M]]></surname>
<given-names><![CDATA[Julio Alejandro]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Gómez-Restrepo]]></surname>
<given-names><![CDATA[Carlos]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Pontificia Universidad Javeriana Facultad de Medicina ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Pontificia Universidad Javeriana Facultad de Medicina Departamento de Psiquiatría y Salud Mental]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>06</month>
<year>2007</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>06</month>
<year>2007</year>
</pub-date>
<volume>36</volume>
<numero>2</numero>
<fpage>340</fpage>
<lpage>348</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0034-74502007000200013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0034-74502007000200013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0034-74502007000200013&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Las escalas como instrumento de medición adquieren particular importancia cuando la variable o entidad que se pretende medir es subjetiva, es decir, que tanto su definición como sus componentes tienen un alto nivel de variabilidad. Dentro de las características que deben estar presentes en cualquier instrumento de medición se incluyen su reproducibilidad, utilidad y validez. La validez permite hacer inferencias y evaluar hipótesis acerca de las personas sobre las cuales estamos empleando las escalas como instrumento de medición. El propósito de este artículo es presentar la importancia y la utilidad de la validez en el proceso de evaluación de escalas. Se describen las diferentes clases de validez y su forma de aplicación en un contexto clínico, para determinar la presencia de este atributo como parte del proceso de validación de escalas.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Scales are of particular importance when the variable or the entity that we pretend to measure is subjective, that is, there is a high degree of variability among its definition and its components. Among the qualities that a measurement instrument must have are its utility, reliability, and validity. Validity allows us to test hypothesis and make inferences about the people being administered with the scale as a measurement instrument. The purpose of this article is to show the importance and the utility of validity in the process of scale-testing. The different classes of validity and their application in a clinical context in order to determine their presence are discussed.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[estudios de validación]]></kwd>
<kwd lng="es"><![CDATA[medición]]></kwd>
<kwd lng="en"><![CDATA[Validation studies]]></kwd>
<kwd lng="en"><![CDATA[measures]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="verdana" size="2">     <p align="right"><b>Metodolog&iacute;a de investigaci&oacute;n y lectura cr&iacute;tica de estudios</b></p>     <p><b>    <center><font face="verdana" size="4">Validez en la evaluaci&oacute;n de escalas</font></center></b></p>     <p>&nbsp;</p>     <p><b>    <center><font face="verdana" size="3"> Validity in Scale-testing.</font></center></b></p>     <p>&nbsp;</p>     <p><b>Julio Alejandro Lamprea M.<sup>1</sup> Carlos G&oacute;mez-Restrepo<sup>2</sup></b></p>     <p><sup><b>1</b></sup> M&eacute;dico. Asistente de investigaci&oacute;n del Departamento de Epidemiolog&iacute;a    Cl&iacute;nica y Bioestad&iacute;stica, Facultad de Medicina, Pontificia Universidad    Javeriana, Bogot&aacute;, Colombia.    ]]></body>
<body><![CDATA[<br> <a href="mailtojlamprea@javeriana.edu.co">jlamprea@javeriana.edu.co</a> </p>     <p> <sup><b>2</b></sup> M&eacute;dico psiquiatra, psicoanalista, MSc. en Epidemiolog&iacute;a Cl&iacute;nica,    profesor asociado del Departamento de Epidemiolog&iacute;a Cl&iacute;nica y    Bioestad&iacute;stica y del Departamento de Psiquiatr&iacute;a y Salud Mental,    coordinador del Programa Psiquiatr&iacute;a de Enlace de la Facultad de Medicina,    Pontificia Universidad Javeriana, Bogot&aacute;, Colombia.</p>       <p>&nbsp;</p> <hr size="1">     <p> <b>Resumen</b></p>     <p> Las escalas como instrumento de medici&oacute;n adquieren particular importancia    cuando la variable o entidad que se pretende medir es subjetiva, es decir, que    tanto su definici&oacute;n como sus componentes tienen un alto nivel de variabilidad.    Dentro de las caracter&iacute;sticas que deben estar presentes en cualquier    instrumento de medici&oacute;n se incluyen su reproducibilidad, utilidad y validez.    La validez permite hacer inferencias y evaluar hip&oacute;tesis acerca de las    personas sobre las cuales estamos empleando las escalas como instrumento de    medici&oacute;n. El prop&oacute;sito de este art&iacute;culo es presentar la    importancia y la utilidad de la validez en el proceso de evaluaci&oacute;n de    escalas. Se describen las diferentes clases de validez y su forma de aplicaci&oacute;n    en un contexto cl&iacute;nico, para determinar la presencia de este atributo    como parte del proceso de validaci&oacute;n de escalas.</p>     <p> <b>Palabras clave:</b> estudios de validaci&oacute;n, medici&oacute;n.</p>     <p>&nbsp;</p> <hr size="1">     <p><b>Abstract</b></p>     <p> Scales are of particular importance when the variable or the entity that we    pretend to measure is subjective, that is, there is a high degree of variability    among its definition and its components. Among the qualities that a measurement    instrument must have are its utility, reliability, and validity. Validity allows    us to test hypothesis and make inferences about the people being administered    with the scale as a measurement instrument. The purpose of this article is to    show the importance and the utility of validity in the process of scale-testing.    The different classes of validity and their application in a clinical context    in order to determine their presence are discussed.</p>     <p> <b>Keywords:</b> Validation studies, measures. </p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p> <hr size="1">     <p><b><font face="verdana" size="3">Introducci&oacute;n</font></b></p>     <p> Una escala puede definirse como la &#8220;colecci&oacute;n de &iacute;tems    que pretenden revelar diferentes niveles de determinadas caracter&iacute;sticas    (variables) no observables directamente. Estas escalas se desarrollan cuando    se quiere medir fen&oacute;menos no directamente observables&#8221; (1). Cantidades    f&iacute;sicas como medici&oacute;n de glucemia, concentraci&oacute;n de hormona    tiroidea, enzimas cardiacas, talla, peso o &iacute;ndice de masa corporal son    observables directamente o con los instrumentos adecuados (2).</p>     <p> Esta medici&oacute;n objetiva de ciertas variables deja poco espacio a la    duda de si en realidad lo que intentamos medir corresponde a dicha variable.    Cuando, por ejemplo, se le toma la presi&oacute;n arterial a una persona, independientemente    de si el instrumento de medici&oacute;n est&aacute; bien calibrado o no, la    pregunta de si en realidad lo que estamos midiendo es la presi&oacute;n arterial    de este paciente y no otra variable, como temperatura o pulso, tiene una respuesta    obvia: lo que estamos midiendo es la presi&oacute;n arterial.</p>     <p> Desafortunadamente en medicina &#8212;y especialmente en psiquiatr&iacute;a&#8212;    es frecuente que no encontremos una medida o un instrumento de medici&oacute;n    &uacute;nico que nos d&eacute; la certeza de que el atributo o la condici&oacute;n    que pretendemos medir corresponde a la realidad.</p>     <p> El problema radica en que las variables con que nos encontramos frecuentemente,    as&iacute; como su medici&oacute;n,&#8220;dependen tanto de sus definiciones,    que var&iacute;an de persona a persona, y de su forma de medici&oacute;n, como    de la relaci&oacute;n entre la observaci&oacute;n y lo que &eacute;sta refleja&#8221;    (2). Por ejemplo, para evaluar la prevalencia del alcoholismo en una poblaci&oacute;n    o para determinar el riesgo individual de tener dependencia o abuso de alcohol    se han elaborado diferentes escalas, cada una con una serie de preguntas que    buscan determinar la presencia de alcoholismo.</p>     <p> Debido a que no existe uniformidad de criterios en cuanto a la definici&oacute;n    ni a la forma de medir esta entidad, as&iacute; como tampoco se tiene certeza    de que ciertas conductas observadas en la poblaci&oacute;n en que se quiere    medir o determinar abuso o dependencia de alcohol (por ejemplo consumo de alcohol    matutino en la escala CAGE de tamizaje para alcoholismo) sean predictivas de    la presencia de tal abuso o dependencia, cada una de estas escalas ha tenido    que ser evaluada para determinar si en realidad los&iacute;tems que en ellas    se incluyen son predictores de la presencia de abuso o dependencia de alcohol,    es decir, si estas escalas son instrumentos de medici&oacute;n v&aacute;lidos.</p>     <p> Aunque el objetivo de este art&iacute;culo es examinar la validez en el proceso    de evaluaci&oacute;n de escalas,es necesario tener en cuenta que en cualquier    instrumento de medici&oacute;n existen otras caracter&iacute;sticas adem&aacute;s    de la validez que deben ser evaluadas. Estas caracter&iacute;sticas incluyen:    confiabilidad, adecuada amplitud de rango, sensibilidad al cambio y utilidad    del instrumento de medici&oacute;n (3). Por esta raz&oacute;n, la validez debe    ser entendida como uno de los atributos que deben ser evaluados en diferentes    instrumentos de medici&oacute;n.</p>     <p> <b><font face="verdana" size="3">Definici&oacute;n</font></b></p>     <p> La validez o exactitud de una escala se refiere al &#8220;grado de confianza    que podemos tener de que la medici&oacute;n corresponde a la realidad del fen&oacute;meno    que se est&aacute; midiendo&#8221; (1). Si, por ejemplo, tenemos los resultados    de una nueva escala que busca determinar la existencia de depresi&oacute;n en    una persona, y se nos informa que los pacientes evaluados obtienen los mismos    puntajes en diferentes ocasiones y que diferentes entrevistadoresobtienen resultados    similares al evaluar al mismo paciente, podemos admitir que la escala es confiable    o reproducible; sin embargo, con estos datos no podemos determinar si la escala    mide la presencia de depresi&oacute;n y no otra condici&oacute;n, como estr&eacute;s,    demencia o ansiedad.</p>     ]]></body>
<body><![CDATA[<p> Aunque necesaria e indispensable en el proceso de validaci&oacute;n de una    escala, la reproducibilidad no es, por s&iacute; sola, suficiente para determinar    la validez de una escala. La validez determina qu&eacute; conclusiones pueden    derivarse de las personas que obtienen diferentes resultados en la escala (4).    Por lo tanto, si en nuestra hipot&eacute;tica escala una persona obtiene un    puntaje alto, &iquest;qu&eacute; tanta confianza podemos tener de que esta persona,    al haber obtenido este puntaje, tenga de hecho depresi&oacute;n y no otra condici&oacute;n    cl&iacute;nica? Otra forma de definirla ser&iacute;a: la validez es el grado    en el cual la evidencia y la teor&iacute;a soportan las interpretaciones obtenidas    de los resultados de las pruebas (escalas, inventarios, etc.), siendo la validez    un concepto unificado, de tal forma que, m&aacute;s que tipos discretos de validez,    existen tipos de evidencia de validez (5,6).</p>     <p> Al aceptar que los procesos de validaci&oacute;n de escalas est&aacute;n encaminados    a las inferencias que se pueden hacer acerca de las caracter&iacute;sticas de    las personas que han obtenido diferentes puntajes en estas escalas, &#8220;la    validez de una escala resulta ser un proceso deevaluaci&oacute;n de hip&oacute;tesis&#8221;    (2).</p>     <p> Retomando nuestro ejemplo de la nueva escala de depresi&oacute;n, al determinar    su validez estar&iacute;amos evaluando la hip&oacute;tesis seg&uacute;n la cual    la escala nos permite concluir que alguien que obtiene un puntaje alto presenta,    de hecho, depresi&oacute;n; adem&aacute;s, permite diferenciar a esta persona    de otras con diferentes entidades y de personas que obtengan puntajes bajos    en esta escala.</p>     <p> De acuerdo con esto, al querer determinar la validez de una escala, las preguntas    necesarias que se deben hacer son: &iquest;la hip&oacute;tesis planteada en    este proceso de validaci&oacute;n guarda relaci&oacute;n con lo que la escala    busca medir? y &iquest;los resultados de esta escala nos permiten hacer las    inferencias que queremos? (2).</p>     <p> Tradicionalmente la validez de una escala se ha dividido en: (a) validez de    apariencia, (b) validez de contenido, (c) validez de criterio y (d) validez    de constructo. Estos componentes, los cuales describiremos a continuaci&oacute;n,    no deben ser entendidos como entidades totalmente diferentes e independientes    unas de otras, sino como criterios que intentan establecer el grado de confianza    que podemos tener de las inferencias que realicemos acerca de las personas que    obtengan puntajes en escalas (2).</p>     <p>a. Validez de apariencia</p>     <p> La validez de apariencia tiene como objetivo responder a la siguiente pregunta:    &iquest;la escala parece medir lo que debe medir? La validez de apariencia &#8220;no    supone un concepto estad&iacute;stico, sino que depende de los juicios que los    expertos hagan sobre la pertinencia de los &iacute;tems de la escala&#8221;    (7).</p>     <p> Para evaluar la validez de apariencia se conforma un grupo de jueces, por    lo general expertos que determinan si en su concepto el instrumento en apariencia    mide las cualidades deseadas, y otro de personas que van a ser evaluadas por    la escala.</p>     <p> La importancia de esta forma de validez radica en la aplicabilidad y en la    aceptabilidad desde el punto de vista del que responde a la escala (4). Por    lo tanto, una persona puede estar m&aacute;s dispuesta a responder un cuestionario    de una escala que quiera determinar ansiedad, si los&iacute;tems aparentemente    est&aacute;n abordando de alguna forma la presencia de esta entidad.</p>     <p> Por el contrario, si en la escala aparecen otros &iacute;tems que puedan ser    juzgados por parte del que responde como irrelevantes, entonces esto har&aacute;    que el cuestionario pierda inter&eacute;s para la persona evaluada y que posiblemente    est&eacute; midiendo otra entidad o constructo. Un &iacute;tem que dice &#8220;La    mayor&iacute;a del tiempo me siento triste&#8221; en apariencia mide depresi&oacute;n;    no obstante, otro que dice&#8220;Siento como si mi pensamiento fuera audible    por las dem&aacute;s personas&#8221; puede corresponder m&aacute;s a un trastorno    esquizofr&eacute;nico que a uno depresivo. En apariencia, medir&iacute;a otra    entidad.</p>     ]]></body>
<body><![CDATA[<p> b. Validez de contenido</p>     <p> Cuando se desarrolla o se quiere evaluar una escala, se debe pretender que    los &iacute;tems en esta escala cubran adecuadamente todos los dominios de la    entidad que se quiere medir. Un dominio es un grupo de caracter&iacute;sticas    que se encuentran com&uacute;nmente presentes en la entidad y los &iacute;tems    son herramientas de exploraci&oacute;n que nos permiten evaluar la presencia    de estos dominios.</p>     <p> En la escala de Glasgow, por ejemplo, que se utiliza en la evaluaci&oacute;n    inicial de pacientes con trauma craneoencef&aacute;lico y cuyo objetivo fundamental    es establecer el pron&oacute;stico de estos pacientes, se establecieron tres    dominios principales (respuesta motora, respuesta verbal y apertura ocular).    Cabe aclarar que cada uno de estos dominios es explorado por &iacute;tems que    establecen el puntaje total de la escala.</p>     <p> Si, para ahorrar tiempo o procurando hacer m&aacute;s simple la anterior escala,    removi&eacute;ramos uno de sus dominios, como la evaluaci&oacute;n de la respuesta    motora, la inferencia acerca del pron&oacute;stico de esta persona basado &uacute;nicamente    en su puntaje en la respuesta verbal y apertura ocular dejar&iacute;a de ser    v&aacute;lida, ya que estar&iacute;amos eliminando de la escala una evaluaci&oacute;n    necesaria para realizar esta inferencia. Es decir, la escala dejar&iacute;a    de tener validez de contenido o, por lo menos, este tipo de validez se ver&iacute;a    comprometida.</p>     <p> En el proceso de construcci&oacute;n de una escala se debe procurar que los    dominios incluidos y los &iacute;tems para explorarlos representen adecuadamente    a la entidad que se va a medir; de esta forma se logra que las inferencias surgidas    a partir de puntajes en la escala sean v&aacute;lidas dentro de un rango amplio    de circunstancias.</p>     <p> En el caso de la calidad de vida existen escalas gen&eacute;ricas, como el    SF-36, que poseen una amplia cantidad de subescalas o dominios: funcionamiento    f&iacute;sico, desempe&ntilde;o f&iacute;sico, dolor corporal, desempe&ntilde;o    emocional, salud mental, vitalidad, salud general, funcionamiento social y,    en algunos, cambio de la salud en el tiempo. Esto nos hace pensar en la necesidad    de medir todas estas subescalas con el fin de tener completo el constructo de    calidad de vida.</p>     <p> Cuando la entidad que se quiere medir es muy heterog&eacute;nea, surge el    problema de que inevitablemente la reproducibilidad de los resultados de la    escala se ver&aacute; comprometida. Por ejemplo, en el lupus eritematoso sist&eacute;mico,    no todos los pacientes que exhiben manifestaciones hematol&oacute;gicas presentan    afectaci&oacute;n renal o cut&aacute;nea; es decir, la entidad presenta poca    consistencia interna (una medida de reproducibilidad), lo que podr&iacute;a    solucionarse incluyendo en la escala &uacute;nicamente dominios que aparezcan    en conjunto con alta frecuencia, mejorando de este modo la confiabilidad de    la escala.</p>     <p> Si esto se hiciera, sin embargo, estar&iacute;amos comprometiendo la validez    de contenido de la escala, puesto que los dominios incluidos que mostrar&iacute;an    mayor consistencia interna no abarcar&iacute;an el espectro real de la entidad,    afectando de esta manera las inferencias que hagamos de la escala. Cuando se    presenta esta disparidad entre confiabilidad de la escala y su validez de contenido,    resulta m&aacute;s adecuado sacrificar en algo la primera con objeto de mantener    la validez de contenido; todo esto, si aceptamos que el principal objetivo es    inferencial, lo cual depende m&aacute;s de la validez de la escala (2). No obstante,    una escala v&aacute;lida pero no confiable de poco servir&iacute;a, puesto que    su no reproducibilidad la har&iacute;a poco &uacute;til en el &aacute;mbito    cl&iacute;nico. De esta forma, es fundamental procurar obtener ambas.</p>     <p> c. Validez de criterio</p>     <p> Para establecer si los puntajes obtenidos a partir de una escala son v&aacute;lidos,    &eacute;sta debe compararse con una forma de medici&oacute;n previamente existente    (patr&oacute;n de oro) que a su vez haya mostrado ser el mejor instrumento disponible    para la medici&oacute;n de la entidad. Cuando realizamos esta comparaci&oacute;n    y aceptamos que existe una adecuada correlaci&oacute;n entre estos dos instrumentos    de medici&oacute;n, estamos asegurando que la escala tiene validez de criterio.    En un estudio cl&iacute;nico reciente (8) se pretendi&oacute; validar una escala    que inclu&iacute;a medidas f&iacute;sicas, como&iacute;ndice de masa corporal    y circunferencia abdominal junto con datos simples de laboratorio &#8212;recuento    de plaquetas y concentraci&oacute;n de glucosa en sangre&#8212; para establecer    el diagn&oacute;stico de enfermedad hep&aacute;tica grasa de origen no alcoh&oacute;lico    con fibrosis avanzada (NAFLD, por su sigla en ingl&eacute;s). El criterio o    patr&oacute;n de oro que se us&oacute; para comparar los puntajes obtenidos    de la escala fue la biopsia hep&aacute;tica.</p>     ]]></body>
<body><![CDATA[<p> La raz&oacute;n para querer validar esta escala como instrumento de medici&oacute;n,    respecto a otro que ya hab&iacute;a demostrado ser preciso, es que si se demostrara    que esta escala se correlaciona adecuadamente con el patr&oacute;n de oro, resultar&iacute;a    entonces m&aacute;s c&oacute;modo y menos riesgoso para el paciente, as&iacute;    como m&aacute;s econ&oacute;mico, y no estar&iacute;a sujeta a errores de muestra,    a diferencia de la biopsia. Estos atributos (menores costos, menor riesgo para    el paciente, procedimiento no invasivo, mayor simplicidad en la aplicaci&oacute;n)    (4) son los que se deben buscar cuando se quiere remplazar un instrumento de    medici&oacute;n por otro ya existente.</p>     <p> En el anterior estudio, debido a que la escala y el criterio (biopsia) se    aplicaron al mismo tiempo, a la validez evaluada se le llama validez concurrente.    Dado que la variable anterior es dicot&oacute;mica (presencia de fibrosis hep&aacute;tica    o no), los datos se pueden agrupar en una tabla de 2 x 2, y se pueden analizar    los resultados usando &iacute;ndices como sensibilidad o especificidad, o valor    predictivo positivo o negativo. Si las variables fueran continuas, ser&iacute;a    necesario usar el coeficiente de correlaci&oacute;n de Pearson (7).</p>     <p> En cualquier caso, lo que se debe buscar es que exista una adecuada correlaci&oacute;n    entre los dos instrumentos de medici&oacute;n. Si la raz&oacute;n para aplicar    el nuevo instrumento es mayor beneficio en los atributos anteriormente discutidos,    con una validez similar al criterio, se buscan&iacute;ndices de correlaci&oacute;n    mayores a 0,8 (es decir, se necesita que exista una alta correlaci&oacute;n).    Si, por el contrario, se quisiera crear una nueva escala m&aacute;s v&aacute;lida    que el anterior instrumento de medici&oacute;n, se deber&iacute;a pretender    obtener correlaciones entre 0,3 y 0,7; en primer lugar, que la correlaci&oacute;n    no sea tan alta, asegurando que los dos instrumentos no est&eacute;n evaluando    el mismo atributo, con lo que se dejar&iacute;a poco espacio para &#8220;que    el nuevo instrumento sea mejor y diferente del original&#8221;; en segundo lugar,    que no sea tan baja como para pensar que los instrumentos no est&aacute;n relacionados,    &#8220;queriendo decir que la escala est&aacute; midiendo algo completamente    diferente del criterio&#8221; (4). Un tipo de validez concurrente en psiquiatr&iacute;a    ser&iacute;a evaluar la entrevista diagn&oacute;stica estructurada (por ejemplo,    CIDI 2.1) para depresi&oacute;n, que actuar&iacute;a como patr&oacute;n de oro,    frente a los resultados del Hamilton, Beck o alguna otra escala para depresi&oacute;n,    que se aplica al mismo individuo. Se esperar&iacute;a que hubiera una alta correlaci&oacute;n    entre los resultados que arroje el CIDI y aquel del Hamilton para depresi&oacute;n.</p>     <p> En el caso de que el criterio o patr&oacute;n de oro no sea evaluado al mismo    tiempo que la nueva escala, sino en alg&uacute;n punto en el futuro, se hablar&iacute;a    de validez predictiva. La validez del nuevo instrumento de medici&oacute;n radicar&iacute;a    en qu&eacute; tan bien predice el puntaje del criterio. Correlacionar puntajes    en la escala de potencial suicida con intentos de suicidio en el futuro (criterio)    (4), o correlacionar una escala que indique adherencia al tratamiento con el    posterior desarrollo de esta adherencia o no (criterio) (1), o una escala que    detecte demencia de Alzheimer incipiente con el posterior diagn&oacute;stico    de demencia de este tipo, son ejemplos de esta clase de validez.</p>     <p> Es necesario aclarar que mientras no se tengan los resultados de la correlaci&oacute;n    en alg&uacute;n punto en el futuro, ninguna decisi&oacute;n se puede hacer bas&aacute;ndose    en la nueva escala, del mismo modo que no se pueden usar atributos del nuevo    instrumento como parte del criterio.</p>     <p> Si, por ejemplo, para validar el uso de una ecograf&iacute;a abdominal para    diagnosticar sangrado abdominal, us&aacute;ramos el juicio cl&iacute;nico como    patr&oacute;n de oro o criterio, el m&eacute;dico podr&iacute;a saber los resultados    de la ecograf&iacute;a, y basar su juicio cl&iacute;nico en los resultados    de &eacute;sta. Esto significar&iacute;a que el diagn&oacute;stico o criterio    estar&iacute;a basado, en parte, en las predicciones del nuevo instrumento    de medici&oacute;n, con lo que se establecer&iacute;a una &#8220;alta correlaci&oacute;n    artificial entre los dos&#8221;, lo que se conoce como contaminaci&oacute;n    del criterio (2). Por este motivo, la medici&oacute;n de ambas deber&iacute;a    idealmente ser ciega, con el fin de que el conocimiento de una no influya sobre    lo que detectamos en la segunda.</p>     <p>   d. Validez de constructo</p>     <p>   En el estudio de la esquizofrenia   con el efecto que tienen los neurol&eacute;pticos   de disminuir la neurotransmisi&oacute;n   de la dopamina, que a su   vez produce una disminuci&oacute;n de los   delirios y alucinaciones experimentados   por los pacientes, se instaur&oacute;   la teor&iacute;a dopamin&eacute;rgica de la esquizofrenia,   que pretend&iacute;a explicar las   diferentes manifestaciones de esta   entidad con fundamento en niveles   anormales de este neurotransmisor.   Sin embargo, pronto se encontraron   las m&uacute;ltiples limitaciones de esta   teor&iacute;a (9).</p>     <p>   Las variadas acciones de la dopamina   en el sistema nervioso central   (SNC), las concentraciones normales   de este neurotransmisor en   personas con esquizofrenia y la falta   de respuesta de ciertos s&iacute;ntomas al   tratamiento con neurol&eacute;pticos llevaron   a plantear nuevas hip&oacute;tesis que   pudieran explicar de una forma m&aacute;s   completa las m&uacute;ltiples manifestaciones   de esta entidad. Es decir, lo   anterior ha conducido al desarrollo   de nuevas &#8220;teor&iacute;as&#8221; que, a su vez,   explican la asociaci&oacute;n entre varios   de los s&iacute;ntomas de esta entidad, o   al desarrollo de constructos te&oacute;ricos   que cumplieran este fin.</p>     <p>   Como se discuti&oacute;, muchos de   los eventos que queremos medir   en medicina (ansiedad, depresi&oacute;n,   esquizofrenia) no son observables directamente, ni existe una prueba   &uacute;nica que nos indique precisamente   la presencia de esta entidad. Por lo   tanto, lo mejor que podemos hacer   para medir estas variables abstractas   es inferir que ciertos atributos   o manifestaciones de la entidad se   correlacionan para explicar la variable   que deseamos medir.</p>     ]]></body>
<body><![CDATA[<p>   Las razones para querer implementar   nuevas teor&iacute;as o constructos   que nos permitan realizar estas   inferencias son, en primer lugar,   que no exista un instrumento de   medici&oacute;n que eval&uacute;e la condici&oacute;n   (por ejemplo, si quisi&eacute;ramos desarrollar   un instrumento que nos   permitiera reunir varios dominios   presentes en personas con riesgo de   cometer asesinatos en serie o masivos)   y, en segundo t&eacute;rmino, que el   instrumento de medici&oacute;n existente   sea juzgado como inv&aacute;lido o impreciso   (4). Esta &uacute;ltima raz&oacute;n difiere   de la validez de criterio en que el   nuevo instrumento de medici&oacute;n no   se desarrolla por razones de costo o   de riesgo para el paciente, sino con   el objetivo de configurar un nuevo   instrumento m&aacute;s adecuado o preciso   que el anterior.</p>     <p>   Para establecer la validez de   un constructo se debe evaluar y   probar la validez de cada parte de   &eacute;ste, es decir, evaluar cada una   de las predicciones que se pueden   hacer sobre el constructo (4). Volviendo   a la teor&iacute;a dopamin&eacute;rgica de   la esquizofrenia, una de nuestras   predicciones podr&iacute;a ser que los   medicamentos antidopamin&eacute;rgicos   causen una remisi&oacute;n de los s&iacute;ntomas   o que personas con esquizofrenia   muestren niveles anormales de   este neurotransmisor.</p>     <p>   Para validar nuestro constructo   hipot&eacute;tico, debemos evaluar cada   una de las predicciones realizadas   a partir del constructo, que de ser   ciertas nos har&iacute;an tener mayor confianza   en nuestra teor&iacute;a, pero que   nunca nos llevar&iacute;an a tener una   certeza total acerca de su validez,   pues si prob&aacute;ramos que una de   nuestras predicciones resulta falsa,   le restar&iacute;a validez al constructo. De   otra forma, al validar un constructo   no s&oacute;lo estamos validando un instrumento   de medici&oacute;n, sino la teor&iacute;a   al mismo tiempo (2).</p>     <p>   Por lo tanto, si son ciertas las   predicciones que hacemos a partir de   la teor&iacute;a, estar&iacute;amos validando tanto   el constructo como el instrumento   de medici&oacute;n. Si, en cambio, la nueva   escala no nos permitiera discernir   entre individuos con diferentes puntajes   en &eacute;sta, tanto la teor&iacute;a como el   instrumento podr&iacute;an estar errados,   o tal vez s&oacute;lo uno de ellos (2).</p>     <p>   <b><font face="verdana" size="3">Conclusi&oacute;n</font></b></p>     <p>   Al evaluar un instrumento de   medici&oacute;n (escalas en este caso) debe   procurarse que cumpla con una   serie de atributos necesarios para   poder ser validado. Estos atributos   incluyen: confiabilidad, sensibilidad   al cambio, adecuada amplitud   de rango, utilidad y validez. Esta   &uacute;ltima caracter&iacute;stica nos permite   generar un grado de confianza con   el cual podamos asegurar que lo que   pretendemos medir corresponde a   la realidad, y que las inferencias acerca de los puntajes obtenidos por   las personas evaluadas por estos   instrumentos sean confiables.</p>     <p>   La validez adquiere particular   importancia cuando los eventos   que buscamos medir no son identificables   directamente, sino que   se construyen a partir de ciertos   atributos, conductas o s&iacute;ntomas   que llamamos dominios, los cuales   se pretende que sean predictivos o   que puedan medir adecuadamente   una condici&oacute;n determinada.</p>     <p>   La validez puede clasificarse en   validez de apariencia, validez de contenido   (que pretende que los dominios   incluidos en el instrumento de medici&oacute;n   representen adecuadamente   el espectro de la entidad), validez de   criterio (donde se encuentra la correlaci&oacute;n   del nuevo instrumento con un   criterio o patr&oacute;n de oro, de manera   concurrente y de forma predictiva)   y validez de constructo (que eval&uacute;a   la precisi&oacute;n de una nueva teor&iacute;a que   remplace un instrumento de medici&oacute;n   existente, o que cree uno nuevo   cuando no se cuente con &eacute;l).</p>     <p>   Aunque resulta m&aacute;s simple realizar   esta divisi&oacute;n para entender el   concepto de validez, es necesario no   desviarse del objetivo principal de este   atributo: permitirnos evaluar hip&oacute;tesis   a partir de los resultados obtenidos   con el instrumento de medici&oacute;n (2).</p>     <p>   <b><font face="verdana" size="3">Referencias</font></b></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>   1. G&oacute;mez C, S&aacute;nchez R. Conceptos b&aacute;sicos   sobre validaci&oacute;n de escalas. Rev   Colomb Psiquiatr. 1998;27:121-30.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000073&pid=S0034-7450200700020001300001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   2. Streiner DL, Norman G. Validity: Health   measurment scales. A practical guide   to their development and Use. Oxford:   Oxford University Press, 2nd ed.; 1995.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000074&pid=S0034-7450200700020001300002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   3. G&oacute;mez C, Ospina MB. Adaptaci&oacute;n y validaci&oacute;n   de escalas. En: Ruiz A, G&oacute;mez   C, Londo&ntilde;o D. Investigaci&oacute;n cl&iacute;nica:   epidemiolog&iacute;a cl&iacute;nica aplicada. Bogot&aacute;:   Centro Editorial Javeriano; 2001.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000075&pid=S0034-7450200700020001300003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   4. Streiner DL. A checklist for evaluating   the usefulness of rating scales. Can J   Psychiatry. 1993;38:140-8.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000076&pid=S0034-7450200700020001300004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   5. Goodwin LD. The meaning of validity. J   Pediatr Gastroenterol Nutr 2002;35:6-7&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000077&pid=S0034-7450200700020001300005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   6. Goodwin LD. Changing conceptions   of measurement validity: an update   on the new standards. J Nurs Educ.   2002;41:100-6.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000078&pid=S0034-7450200700020001300006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   7. S&aacute;nchez R, Echeverry J. Validaci&oacute;n   de escalas de medici&oacute;n en salud. Rev   Salud P&uacute;blica. 2004;6:302-18.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000079&pid=S0034-7450200700020001300007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   8. Angulo P et al. The NAFLD fibrosis score:   a noninvasive system that identifies liver   fibrosis in patients with NAFLD. Hepatology.   2007; 45:846-54.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000080&pid=S0034-7450200700020001300008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   9. Freedman R. Schizophrenia. N Engl J   Med. 2003;349:1738-49.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000081&pid=S0034-7450200700020001300009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p>   Recibido para evaluaci&oacute;n: 4 de abril de 2007   Aceptado para publicaci&oacute;n: 22 de mayo de 2007</p>   </font>     ]]></body>
<body><![CDATA[ ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Sánchez]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Conceptos básicos sobre validación de escalas]]></article-title>
<source><![CDATA[Rev Colomb Psiquiatr]]></source>
<year>1998</year>
<volume>27</volume>
<page-range>121-30</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Streiner]]></surname>
<given-names><![CDATA[DL]]></given-names>
</name>
<name>
<surname><![CDATA[Norman]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[Validity: Health measurment scales: A practical guide to their development and Use]]></source>
<year>1995</year>
<edition>2</edition>
<publisher-loc><![CDATA[Oxford ]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Ospina]]></surname>
<given-names><![CDATA[MB]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Adaptación y validación de escalas]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Ruiz]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Londoño]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Investigación clínica: epidemiología clínica aplicada]]></source>
<year>2001</year>
<publisher-loc><![CDATA[Bogotá ]]></publisher-loc>
<publisher-name><![CDATA[Centro Editorial Javeriano]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Streiner]]></surname>
<given-names><![CDATA[DL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A checklist for evaluating the usefulness of rating scales]]></article-title>
<source><![CDATA[Can J Psychiatry]]></source>
<year>1993</year>
<volume>38</volume>
<page-range>140-8</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goodwin]]></surname>
<given-names><![CDATA[LD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The meaning of validity]]></article-title>
<source><![CDATA[J Pediatr Gastroenterol Nutr]]></source>
<year>2002</year>
<volume>35</volume>
<page-range>6-7</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goodwin]]></surname>
<given-names><![CDATA[LD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Changing conceptions of measurement validity: an update on the new standards]]></article-title>
<source><![CDATA[J Nurs Educ]]></source>
<year>2002</year>
<volume>41</volume>
<page-range>100-6</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sánchez]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Echeverry]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Validación de escalas de medición en salud]]></article-title>
<source><![CDATA[Rev Salud Pública]]></source>
<year>2004</year>
<volume>6</volume>
<page-range>302-18</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Angulo]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The NAFLD fibrosis score: a noninvasive system that identifies liver fibrosis in patients with NAFLD]]></article-title>
<source><![CDATA[Hepatology]]></source>
<year>2007</year>
<volume>45</volume>
<page-range>846-54</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Freedman]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[N Engl J Med]]></source>
<year>2003</year>
<volume>349</volume>
<page-range>1738-49</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
