<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0034-7450</journal-id>
<journal-title><![CDATA[Revista Colombiana de Psiquiatría]]></journal-title>
<abbrev-journal-title><![CDATA[rev.colomb.psiquiatr.]]></abbrev-journal-title>
<issn>0034-7450</issn>
<publisher>
<publisher-name><![CDATA[Asociacion Colombiana de Psiquiatria.]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0034-74502009000300013</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Más allá del valor p]]></article-title>
<article-title xml:lang="en"><![CDATA[Beyond p value]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Monterrey Gutiérrez]]></surname>
<given-names><![CDATA[Pedro Agustín]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Gómez-Restrepo]]></surname>
<given-names><![CDATA[Carlos]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Pontificia Universidad Javeriana Departamento de Epidemiología Clínica y Bioestadística ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Pontificia Universidad Javeriana Departamento de Psiquiatría y Salud Mental ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2009</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2009</year>
</pub-date>
<volume>38</volume>
<numero>3</numero>
<fpage>574</fpage>
<lpage>586</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0034-74502009000300013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0034-74502009000300013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0034-74502009000300013&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Introducción: En medicina se ha privilegiado el valor p y lo que éste aporta. No obstante, cada día se usan otros criterios, como el intervalo de confianza, y nuevas formulaciones de las pruebas de hipótesis que pueden proveer más profundidad en la identificación de resultados clínicamente relevantes. Objetivos: Exponer criterios y pruebas de hipótesis que vayan más allá del valor p. Resultados: Se da una explicación a los intervalos de confianza y a diferentes pruebas de hipótesis para identificar, en el análisis de los datos de la investigación, los valores clínicamente relevantes. Conclusión: El valor p, los intervalos de confianza y la identificación de diferencias clínicamente relevantes por medio del uso de hipótesis de superioridad, de no inferioridad y de equivalencia son fundamentales para la investigación clínica.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Introduction: In medicine the p value has had an important place because of its contribution. In addition the confidence intervals and new formulations of significant test are used every day as a way to identify clinically relevant results. Objective: To describe the criteria and the significant test beyond the p value. Results: Confidence intervals and significant tests are review to identify in data analysis clinically relevant findings. Conclusion: The p value, confidence intervals and the identification of clinically relevant findings by means of superiority, non-inferiority and equivalence hypothesis are fundamentals in clinical research.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[valor p]]></kwd>
<kwd lng="es"><![CDATA[intervalos de confianza]]></kwd>
<kwd lng="es"><![CDATA[diferencia clínica relevante]]></kwd>
<kwd lng="es"><![CDATA[significación estadística]]></kwd>
<kwd lng="en"><![CDATA[P value]]></kwd>
<kwd lng="en"><![CDATA[confidence intervals]]></kwd>
<kwd lng="en"><![CDATA[relevant clinical difference]]></kwd>
<kwd lng="en"><![CDATA[statistical signification]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="verdana" size="2">      <p align="right"><b>Metodolog&iacute;a de investigaci&oacute;n y lectura cr&iacute;tica    de estudios</b></p>     <p align="center">   <font size="4"><b>M&aacute;s all&aacute; del valor p</b></font></p>     <p align="center"><font size="3"><b>Beyond p value</b></font></p>     <p>   <b>Pedro Agust&iacute;n Monterrey Guti&eacute;rrez<sup>1</sup>, Carlos G&oacute;mez-Restrepo<sup>2</sup></b></p>     <p><b><sup>1</sup></b> Ph. D. en Matem&aacute;ticas. Profesor asociado del Departamento de Epidemiolog&iacute;a    Cl&iacute;nica   y Bioestad&iacute;stica, Pontificia Universidad Javeriana, Bogot&aacute; Colombia.</p>     <p>   <b><sup>2</sup></b> Psiquiatra, psicoanalista, MSc en Epidemiolog&iacute;a Cl&iacute;nica. Profesor    del Departamento de   Psiquiatr&iacute;a y Salud Mental y del Departamento de Epidemiolog&iacute;a    Cl&iacute;nica y Bioestad&iacute;stica.   Coordinador de la Especialidad en Psiquiatr&iacute;a de Enlace. Pontificia Universidad   Javeriana, Bogot&aacute;, Colombia.</p>     <p>  Correspondencia   Pedro Monterrey   Hospital Universitario San Ignacio   Departamento de Epidemiolog&iacute;a Cl&iacute;nica y Bioestad&iacute;stica.   Carrera 7&ordf; No. 40-62, 2&ordm; piso   Bogot&aacute;, Colombia <a href="mailto:pmonterrey@javeriana.edu.co">pmonterrey@javeriana.edu.co </a></p>     <p>Recibido para evaluaci&oacute;n: 7 de abril del 2009 Aprobado para publicaci&oacute;n: 17 de julio del 2009</p><hr size="1">      <p>   <b>Resumen</b></p>     ]]></body>
<body><![CDATA[<p>   Introducci&oacute;n: En medicina se ha privilegiado el valor p y lo que &eacute;ste    aporta. No obstante, cada   d&iacute;a se usan otros criterios, como el intervalo de confianza, y nuevas    formulaciones de las   pruebas de hip&oacute;tesis que pueden proveer m&aacute;s profundidad en la    identificaci&oacute;n de resultados   cl&iacute;nicamente relevantes. Objetivos: Exponer criterios y pruebas de hip&oacute;tesis    que vayan m&aacute;s   all&aacute; del valor p. Resultados: Se da una explicaci&oacute;n a los intervalos    de confianza y a diferentes   pruebas de hip&oacute;tesis para identificar, en el an&aacute;lisis de los datos    de la investigaci&oacute;n, los valores   cl&iacute;nicamente relevantes. Conclusi&oacute;n: El valor p, los intervalos    de confianza y la identificaci&oacute;n   de diferencias cl&iacute;nicamente relevantes por medio del uso de hip&oacute;tesis    de superioridad, de no   inferioridad y de equivalencia son fundamentales para la investigaci&oacute;n    cl&iacute;nica.</p>     <p>   <b>Palabras clave</b>: valor p, intervalos de confianza, diferencia cl&iacute;nica    relevante, significaci&oacute;n   estad&iacute;stica.</p><hr size="1">      <p>      Introduction: In medicine the p value has had an important place because of    its contribution.   In addition the confidence intervals and new formulations of significant test    are used every   day as a way to identify clinically relevant results. Objective: To describe    the criteria and the   significant test beyond the p value. Results: Confidence intervals and significant    tests are   review to identify in data analysis clinically relevant findings. Conclusion:    The p value, confidence   intervals and the identification of clinically relevant findings by means of    superiority,   non-inferiority and equivalence hypothesis are fundamentals in clinical research.</p>     <p>   <b>Key words</b>: P value, confidence intervals, relevant clinical difference, statistical    signification </p><hr size="1">      <p><b><font size="3">Introducci&oacute;n</font></b></p>     <p>   En un art&iacute;culo previo (1) analizamos   las cr&iacute;ticas a las pruebas de   hip&oacute;tesis en el marco de su desarrollo   hist&oacute;rico. En &eacute;l se mostr&oacute; c&oacute;mo   diferentes aspectos en la historia   de las pruebas de significaci&oacute;n han   condicionado las deficiencias que   son reportadas actualmente en su   uso; deficiencias que se han traducido en limitaciones y restricciones   como las reflejadas en la Normas de   Vancouver (2).</p>     <p>   Las dificultades con las pruebas   de hip&oacute;tesis se han derivado de inconsistencias   te&oacute;ricas de la t&eacute;cnica   (1) y de un uso deficiente de esos   procedimientos, aunque matizado   ello por el mal h&aacute;bito de reducir su   aplicaci&oacute;n a la ejecuci&oacute;n de un algoritmo   de conducta que dicotomiza el   an&aacute;lisis de los datos que lo reduce a   dos categor&iacute;as: acepto/rechazo.</p>     <p>   Como parte de los mecanismos   de an&aacute;lisis con los que se ha pretendido   suplir los problemas en tal sentido,   ha comenzado a introducirse   una cierta carga de subjetivismo en   el an&aacute;lisis de datos de las diferentes   &aacute;reas de la biomedicina (1,3). Estas   nuevas limitaciones tienen un eje   central en el uso inadecuado de la   plausibilidad biol&oacute;gica, a lo cual   se adiciona un manejo deficiente   de la informaci&oacute;n que brindan los   intervalos de confianza, y que permitir&iacute;a,   en caso de ser utilizados   adecuadamente, complementar la   informaci&oacute;n del valor p obtenido en   la prueba de hip&oacute;tesis.</p>     <p>   Fleiss (4) se&ntilde;al&oacute; que las pruebas   de hip&oacute;tesis tienen una funci&oacute;n   importante en el an&aacute;lisis de datos;   sin embargo, es dif&iacute;cil encontrar   en las revistas cient&iacute;ficas del tema   art&iacute;culos que las defiendan: ciertamente,   existen, pero lo habitual   en la literatura es criticarlas y promover   que no sean utilizadas. Esta   situaci&oacute;n genera un contrasentido,   pues, por una parte, se siguen   utilizando en la inmensa mayor&iacute;a   de las publicaciones donde se dan   resultados de las investigaciones,   y, por la otra, la inmensa mayor&iacute;a   de los art&iacute;culos metodol&oacute;gicos estimula   su no utilizaci&oacute;n. Este art&iacute;culo   pretende mostrar c&oacute;mo se logra un   uso eficiente de las pruebas de hip&oacute;tesis,   para poder seguir utiliz&aacute;ndolas   y no desechar la objetividad   que ellas podr&iacute;an introducir en los   an&aacute;lisis. El punto central est&aacute; en la   identificaci&oacute;n de c&oacute;mo la relevancia   biol&oacute;gica del resultado puede vincularse   con la metodolog&iacute;a de las   pruebas de significaci&oacute;n.</p>     <p>   El punto de partida de esta propuesta   metodol&oacute;gica fue que el uso   eficiente de las pruebas de hip&oacute;tesis   queda determinado por el sustrato   cl&iacute;nico y estad&iacute;stico de su aplicaci&oacute;n,   as&iacute; como por la comprensi&oacute;n del   alcance y el significado de las conclusiones   que se deriven de su uso:   las pruebas de significaci&oacute;n brindan   una base objetiva para los an&aacute;lisis al   presentar y cuantificar la evidencia   contenida en los datos contra la hip&oacute;tesis   nula; es decir, contra la hip&oacute;tesis   que interesa evaluar.</p>     ]]></body>
<body><![CDATA[<p>   La relevancia del planteamiento   metodol&oacute;gico que se pretende hacer   en este art&iacute;culo est&aacute; en que llena   un vac&iacute;o en la literatura docente,   pues, lamentablemente, muchos   de los libros de texto con los que   se ense&ntilde;a la estad&iacute;stica, tanto en   el pregrado como en el postgrado   de las ciencias biom&eacute;dicas, tienen   serias limitaciones metodol&oacute;gicas   al presentar las pruebas de hip&oacute;tesis   (5), por lo que han contribuido,   y contin&uacute;an contribuyendo, a los problemas que se han presentado   en su aplicaci&oacute;n.</p>     <p>   Este art&iacute;culo pretende mostrar   c&oacute;mo debe plantearse un problema,   de qu&eacute; manera identificar las hip&oacute;tesis   estad&iacute;sticas m&aacute;s pertinentes e   indicar c&oacute;mo la relevancia biol&oacute;gica   del resultado puede formar parte   del planteamiento del problema; eso   asegurar&iacute;a que el propio an&aacute;lisis de   los datos se derive de aquella, con   lo que se ganar&iacute;a en objetividad al   realizar el an&aacute;lisis de los datos de las   investigaciones. Adicionalmente se   analizar&aacute; la manera m&aacute;s adecuada   de utilizar los intervalos de confianza   como complemento a las pruebas   de hip&oacute;tesis, al resaltar qu&eacute; nueva   informaci&oacute;n podr&iacute;a introducir su   aplicaci&oacute;n en el proceso de an&aacute;lisis   utilizando las pruebas de hip&oacute;tesis.</p>     <p>   <font size="3"><b>Las hip&oacute;tesis estad&iacute;sticas en el   centro del problema</b></font></p>     <p>   La metodolog&iacute;a del planteamiento   de un problema de investigaci&oacute;n   establece la necesidad de   identificar una pregunta de investigaci&oacute;n;   en muchos casos ella es una   pregunta cl&iacute;nica que se deriva de un   inter&eacute;s asistencial espec&iacute;fico. Esta   pregunta de investigaci&oacute;n viene   acompa&ntilde;ada por una hip&oacute;tesis de   investigaci&oacute;n, la que se construye   a partir de una de las posibles respuestas   a la pregunta de investigaci&oacute;n   (6). La respuesta a la pregunta   de investigaci&oacute;n se basa en determinar   la veracidad de la hip&oacute;tesis   de investigaci&oacute;n, decisi&oacute;n que se   toma a partir de los datos obtenidos   en la investigaci&oacute;n que se dise&ntilde;e   para tal fin. Los datos contienen la   informaci&oacute;n que permitir&aacute; validar   la hip&oacute;tesis de investigaci&oacute;n; para   enjuiciar esa informaci&oacute;n y orientar   el proceso de decisi&oacute;n se construyen   las hip&oacute;tesis estad&iacute;sticas.</p>     <p> Las hip&oacute;tesis estad&iacute;sticas representan   un punto medio entre los   datos y la hip&oacute;tesis de investigaci&oacute;n.   Estas se formulan en t&eacute;rminos de   elementos de las distribuciones de   probabilidad, distribuciones que, a   su vez, son entes te&oacute;ricos que representan   las frecuencias observadas   en los datos de las variables del estudio.   As&iacute;, si en un ensayo cl&iacute;nico se   pretende medir la eficacia de dos intervenciones   psicoterap&eacute;uticas para   el manejo de la distimia, entrevista   motivacional vs. terapia cognitiva, la   pregunta de investigaci&oacute;n se referir&iacute;a   a la semejanza de las intervenciones   o a que alguna de ellas pudiera resultar   m&aacute;s efectiva que la otra.</p>     <p>   De la pregunta elegida se derivar&iacute;a   la hip&oacute;tesis de investigaci&oacute;n,   la cual establecer&iacute;a un planteamiento   general en la comparaci&oacute;n de las   dos intervenciones bajo estudio.   Para tomar una posici&oacute;n acerca de   su validez se realizar&iacute;a el ensayo   cl&iacute;nico, en el que diferentes mediciones   brindar&iacute;an la informaci&oacute;n   necesaria.</p>     <p>   La combinaci&oacute;n de las evidencias   brindadas por esas mediciones,   sea a favor o en contra de las intervenciones,   ser&iacute;a la evidencia experimental   sobre la base de la cual se   debe decidir acerca de la validez o   no de la hip&oacute;tesis de investigaci&oacute;n; por ejemplo, como medida    de desenlace,   se podr&iacute;a optar por una medici&oacute;n   del nivel de depresi&oacute;n mediante   la escala de Zung: la respuesta a la   pregunta de investigaci&oacute;n tendr&iacute;a   como componente la comparaci&oacute;n   del comportamiento de los valores   del puntaje de Zung en ambos   grupos, y esta comparaci&oacute;n podr&iacute;a   consistir en comparar los promedios   de puntaje de Zung para ambos grupos,   o en comprar los porcentajes   de pacientes con mejor&iacute;a en cada   grupo de tratamiento, y definir como   mejor&iacute;a si se obten&iacute;a una reducci&oacute;n   del 30 % de los valores iniciales de   depresi&oacute;n, de acuerdo con la escala.   Como se aprecia a ra&iacute;z del ejemplo,   diferentes criterios de construcci&oacute;n   de hip&oacute;tesis estad&iacute;sticas pueden ser   utilizados alternativamente para   dar respuesta a una misma pregunta   de investigaci&oacute;n.</p>     <p>   Lo usual en la construcci&oacute;n de   las hip&oacute;tesis estad&iacute;sticas es identificar   una hip&oacute;tesis nula o de no   cambio, hip&oacute;tesis que se identifica   como H0. Para decidir si, sobre la   base de los datos, se puede rechazar   H0, se calcula la probabilidad   de obtener la muestra observada   o muestras "m&aacute;s extremas" en la   direcci&oacute;n en que H0 no sea cierta; es   decir, la probabilidad de muestras   que determinen el rechazo de H0.   Este valor se conoce con el nombre   de valor p, y es calculado por los   sistemas computacionales para el   an&aacute;lisis estad&iacute;stico.</p>     <p>   Por ejemplo, si se comparan las   medias de dos poblaciones, como se   podr&iacute;a hacer en el ensayo cl&iacute;nico, la   hip&oacute;tesis nula para considerar ser&iacute;a   H<sub>o</sub>: &micro;<sub>grupo 1</sub> = &micro;<sub>grupo 2</sub>; la probabilidad   buscada ser&iacute;a la correspondiente a   las muestras en las que sus medias   tendr&iacute;an una diferencia mucho mayor   que la observada en los datos   que se analizan, y donde ser&iacute;an las   diferencias de inter&eacute;s las que correspondan   con la direcci&oacute;n de las   diferencias que identifica H<sub>A</sub>. Esta   probabilidad, el valor p, es el centro   del proceso de decisi&oacute;n en el que se   pretende aceptar o rechazar H<sub>o</sub>.</p>     <p>   Los valores p cuantifican la   discrepancia entre los datos y la   hip&oacute;tesis nula (7); a medida que el   valor p sea m&aacute;s peque&ntilde;o se considera   m&aacute;s fuerte la evidencia contra   H<sub>o</sub>, y m&aacute;s factible, la posibilidad de   que el cambio o diferencia indicado   por la hip&oacute;tesis alternativa, si existe   alternativa, sea cierto; si no existe   una alternativa plausible, la decisi&oacute;n   ser&iacute;a que no se encontraron   evidencias de que H<sub>o</sub> sea cierta. En   el caso contrario, es decir p elevado,   se acepta H<sub>o</sub>; es decir, se acepta que   no hay cambio.</p>     ]]></body>
<body><![CDATA[<p>   Por ejemplo, en el caso de la distimia,   si la diferencia entre ambos   grupos, entrevista motivacional y   terapia cognoscitiva fuera a favor de   la terapia cognitiva al comparar las   medias con un valor p = 0,00001,   se concluir&iacute;a que la terapia cognoscitiva   es m&aacute;s eficaz para el manejo   de la distimia, en tanto que si el   valor p fuese igual a 0,9999 se concluir&iacute;a   que no se puede rechazar la   hip&oacute;tesis nula de igualdad de los   dos tipos de intervenci&oacute;n. Valores   tales como p = 0,061 indican una d&eacute;bil evidencia contra la hip&oacute;tesis   de nulidad, y, en correspondencia,   ser&iacute;an portadores de una cierta incertidumbre   en la decisi&oacute;n (8).</p>     <p>   Existen algunas creencias err&oacute;neas   al interpretar el valor p: por   ejemplo, es falsa la afirmaci&oacute;n de   que el valor p representa la probabilidad   de que H<sub>o</sub> sea cierta, y tambi&eacute;n   es falso que p mida o caracterice la   magnitud de las diferencias entre   los grupos que se comparan, o de   los efectos bajo estudio, y tambi&eacute;n   es falso que, como consecuencia,   mientras p sea m&aacute;s peque&ntilde;o mayor   es la diferencia o el efecto. El valor   p no mide ni cuantifica efectos: s&oacute;lo   indica la evidencia de los datos a   favor o en contra de la validez de H<sub>o</sub>.   Es importante recordar el car&aacute;cter   aleatorio del valor p.</p>     <p>   Un error muy difundido en el   uso de los valores p es tratar de   dicotomizar la decisi&oacute;n: los libros   de estad&iacute;stica recomiendan tomar   un valor a, usualmente 0,05, como   valor de umbral para esa dicotomizaci&oacute;n,   y enfocar el an&aacute;lisis seg&uacute;n   el siguiente algoritmo: si p &lt; 0,05   rechazar H<sub>o</sub>, y en caso contrario,   aceptarla (9,10). Esta forma de   proceder es incorrecta, como fue argumentado   en el art&iacute;culo previo (1).   Por ejemplo, si un estudio obtiene   p = 0,04999 rechaza H<sub>o</sub> porque p &lt;   0,05; pero si hubiera obtenido p =   0,05001 en ese caso acepta H<sub>o</sub>, porque   p &gt; 0,05. La inconsistencia salta   a la vista: los dos valores p que se   utilizan se diferencian en 0,00002;   es decir, son pr&aacute;cticamente iguales,   y, sin embargo, conducen a dos   conclusiones absolutamente distintas.   Lo relevante ser&iacute;a publicar   el valor p en la cuant&iacute;a en que fue   observado, y analizarlo siguiendo   las recomendaciones de Sterne y   Smith (1,8).</p>     <p>   En ning&uacute;n caso los datos deben   ser analizados mediante un algoritmo   de conducta que dicotomice el   proceso de an&aacute;lisis en un acepto/   rechazo, proceso que no tiene en   cuenta ninguno de los matices de   los datos, ni el propio significado   de las mediciones. Esta forma de   conducta en los an&aacute;lisis necesita   cambios conceptuales en la forma   de ver las pruebas de hip&oacute;tesis: la   cuesti&oacute;n primaria es que no interesa   saber si las diferencias son   significativas o no: lo relevante en   realidad es saber de cu&aacute;nta evidencia   disponemos para afirmar que la   hip&oacute;tesis nula es cierta o no, y esto   lo cuantifica el valor p.</p>     <p>   <font size="3"><b>Los intervalos de confianza   como parte del an&aacute;lisis</b></font></p>     <p>   Los libros de texto de estad&iacute;stica   (9,10) recomiendan utilizar los   intervalos de confianza como un   sustituto del proceso de decisi&oacute;n   con las pruebas de hip&oacute;tesis. Para   ello, indican construir un intervalo   de confianza que estime el par&aacute;metro   que se analiza en la hip&oacute;tesis, y   utilizar esa estimaci&oacute;n como una   pauta para decidir.</p>     <p>   Ejemplo de ello ser&iacute;a un experimento   cl&iacute;nico controlado en el cual   se compare la eficacia de dos tratamientos   para la reducci&oacute;n de delirios en pacientes con esquizofrenia;   como medida de inter&eacute;s, se podr&iacute;a   considerar el n&uacute;mero de actividades   delirantes, y la hip&oacute;tesis estad&iacute;stica   podr&iacute;a ser H<sub>o</sub>:&micro;<sub>tratamiento1</sub> = &micro;<sub>tratamiento2</sub>,   que compara las medias de los dos   grupos y establece su semejanza;   como resultado del ensayo cl&iacute;nico,   la estimaci&oacute;n mediante un intervalo   de confianza del 95% de &micro;<sub>tratamiento1</sub>   &micro;<sub>tratamiento2</sub> bien podr&iacute;a ser que esa   diferencia sea un valor entre -4 y 5,   lo cual indicar&iacute;a que H<sub>o</sub> no debe ser   rechazada; sin embargo, si la estimaci&oacute;n   obtenida hubiera sido entre   3 y 5 indicar&iacute;a que el Tratamiento 1   tiene valores superiores, por lo que   se rechazar&iacute;a H<sub>0</sub>.</p>     <p>   Esta forma de proceder es parcialmente   correcta; su limitaci&oacute;n   est&aacute; en que tambi&eacute;n se traduce en   un algoritmo que esquematiza el proceso   de an&aacute;lisis. Como fue referido   en (1), eso equivale a dicotomizar   la decisi&oacute;n utilizando el valor p y el   umbral a (5,8). Pretender eliminar   los problemas de las pruebas de   hip&oacute;tesis con este procedimiento es   una falacia, se traduce en hacer lo   mismo de una forma diferente; lo   grave es que se piensa que se est&aacute;   haciendo algo distinto, y que, por   tanto, se eliminaron los problemas.</p>     <p>   El verdadero aporte del intervalo   de confianza, aquello que lo diferencia   de las pruebas de hip&oacute;tesis   en el proceso de decisi&oacute;n, est&aacute; en el   significado biol&oacute;gico de sus valores   como estimaci&oacute;n de los par&aacute;metros   de inter&eacute;s y en su di&aacute;metro; es   decir, su amplitud, entendida &eacute;sta   como la diferencia o separaci&oacute;n   entre sus valores. El di&aacute;metro es   una medida de la incertidumbre en   la estimaci&oacute;n, incertidumbre que   se presenta como consecuencia   del efecto del azar; ella es consecuencia   directa de limitaciones en   el tama&ntilde;o de muestra y del propio   esquema de muestreo. El di&aacute;metro   del intervalo de confianza es directamente   proporcional a la variabilidad   del estimador que se utiliza en su   construcci&oacute;n, estimador que, a su   vez, aproxima al par&aacute;metro que se   pretende analizar. Con poca informaci&oacute;n   en la muestra no es posible   emitir juicios seguros, pues la variabilidad   ser&iacute;a grande.</p>     <p>   Informaci&oacute;n en la muestra   y exactitud en las conclusiones   son dos categor&iacute;as inversamente   proporcionales. Por ejemplo, en   un estudio de casos y controles   que pretende estudiar los factores   de riesgo asociados a la presencia   de un cuadro de hipocondr&iacute;a se   tendr&iacute;an los siguientes factores de   riesgo y sus respectivos OR (odds   ratios) e intervalos de confianza:</p>     ]]></body>
<body><![CDATA[<p>   &bull; Maltrato durante la infancia.   OR= 1,2 (0,4 &ndash; 84) es un intervalo   amplio, que contiene 1; esto es,   la no diferencia. Por otra parte,   el intervalo muestra en un extremo   que es protector, y en el otro   tiene 84 odds m&aacute;s de presentar   hipocondr&iacute;a. La amplitud del   intervalo es muy grande, como   consecuencia de una elevada   variabilidad en la estimaci&oacute;n   del OR. Eso significar&iacute;a que los   niveles de incertidumbre de la estimaci&oacute;n son grandes, y eso se   refleja en la estimaci&oacute;n y, consecuentemente,   en la calidad de la   inferencia.</p>     <p>   &bull; Hospitalizaciones en la primera   infancia. OR=2,5 (1,5-3,4) es un   intervalo bastante estrecho, lo   que ser&iacute;a un reflejo de una variabilidad   baja de la estimaci&oacute;n   del OR; es decir, un efecto del   azar no muy elevado, y, en correspondencia,   la estimaci&oacute;n y   los juicios que de ella se deriven   ser&iacute;an m&aacute;s confiables. Muestra   c&oacute;mo las internaciones durante   la primera infancia pueden estar   asociadas a un mayor riesgo   de presentar hipocondr&iacute;a. En   el caso de este estudio, el OR   oscilar&iacute;a entre 1,5 y 3,4.</p>     <p>   &bull; Herencia de hipocondr&iacute;a. OR=4   (3, 267) es un intervalo bastante   amplio y, por ello, poco preciso.   Ello puede obedecer a la falta de   poder del estudio para detectar   y determinar esta variable.</p>     <p>   <b><font size="3">¿C&oacute;mo utilizar la relevancia   cl&iacute;nica de un resultado en   los an&aacute;lisis? La superioridad,   inferioridad y equivalencia   como su reflejo</font></b></p>     <p>   Ante las limitaciones de las   pruebas de hip&oacute;tesis se ha generalizado   la recomendaci&oacute;n de identificar   la plausibilidad biol&oacute;gica (cl&iacute;nica)   de los resultados. El momento de   confusi&oacute;n se genera al determinar   qu&eacute; se entiende por introducir la   plausibilidad biol&oacute;gica (cl&iacute;nica) en   el an&aacute;lisis.</p>     <p>   El procedimiento m&aacute;s socorrido   es aplicar la prueba de hip&oacute;tesis,   y si su conclusi&oacute;n no es aceptable   para el investigador, &eacute;ste no asume   el resultado, sino que comenta un   argumento estad&iacute;stico, como "lo que   est&aacute; observando es reflejo de insuficiencias   en el tama&ntilde;o muestral",   o algo semejante, y, en consecuencia,   concluye que no es relevante.   De esta manera se introduce un   subjetivismo en los an&aacute;lisis, lo cual   es contrario a la objetividad que se   pretende lograr con las pruebas   de hip&oacute;tesis: objetividad, que es   el fundamento de su uso. En pocas   palabras, si el investigador al   final del estudio decide lo que es   relevante y lo que no, &iquest;para qu&eacute; le   sirven los datos? Esta situaci&oacute;n es   contradictoria e introduce un subjetivismo   inaceptable en el marco de   la imparcialidad y objetividad que se   deben exigir a un criterio de an&aacute;lisis   de datos. La tarea a este respecto es   poner en concordancia el an&aacute;lisis   estad&iacute;stico con lo que se entiende   es relevante seg&uacute;n la biolog&iacute;a del   problema, e introducir &eacute;sta en los   an&aacute;lisis de manera independiente,   que las conclusiones se obtengan   independientemente de los juicios   "personales" del investigador.</p>     <p>   El tama&ntilde;o de muestra debe ser   establecido a priori, es uno de los   componentes centrales del dise&ntilde;o   del estudio y est&aacute; directamente   relacionado con su alcance y sus limitaciones:   medici&oacute;n que no pueda   ser tratada con la calidad necesaria   no debe ser analizada; sencillamente,   el estudio no fue dise&ntilde;ado para eso. &Eacute;sta es una decisi&oacute;n    que se   toma en el momento del dise&ntilde;o de   la investigaci&oacute;n; es decir, se toma a   priori, no a posteriori, si el investigador   descubre que los resultados   no son como deseaba.</p>     <p>   Cuando se introduce la hip&oacute;tesis   nula como hip&oacute;tesis de no cambio o   de semejanza, y se pretende con ello   analizar si existen o no "diferencias   significativas", no siempre se est&aacute;   siendo consecuente con lo que es   biol&oacute;gica o cl&iacute;nicamente relevante en   el problema como cambio.</p>     <p>   Por ejemplo: en estudios con   antidepresivos, se podr&iacute;a determinar   cu&aacute;l es el nivel m&iacute;nimo de   diferencia de los valores encontrados   en la escala de Hamilton para   medir s&iacute;ntomas depresivos entre los   grupos comparados; valdr&iacute;a la pena   preguntarse: &iquest;cu&aacute;l es la diferencia   m&iacute;nima relevante para considerar   que un tratamiento antidepresivo   es mejor que otro?</p>     <p>   Una diferencia de 2 o 3 puntos   en la escala de Hamilton podr&iacute;a ser   estad&iacute;sticamente significativa, pero,   &iquest;es cl&iacute;nicamente relevante? &iquest;Cu&aacute;l   es el valor (delta) m&iacute;nimo para considerar   una diferencia cl&iacute;nicamente   relevante en este caso? Siendo   consecuentes con la definici&oacute;n de   la escala, la respuesta ser&iacute;an 5 o 6   puntos, o incluso m&aacute;s. Esta consideraci&oacute;n   es de gran importancia al   momento de determinar qu&eacute; diferencia   se espera encontrar, y c&oacute;mo   ella determina cambios relevantes   en los valores de la escala.</p>     ]]></body>
<body><![CDATA[<p>   Dicha situaci&oacute;n fue identificada   por Cohen (11), quien en 1994 denomin&oacute;   hip&oacute;tesis nada a la hip&oacute;tesis   nula de no cambio (null hypothesis).   Es un hecho reconocido entre los   profesionales de la estad&iacute;stica que   estas hip&oacute;tesis, en muchos casos,   son irrelevantes en el proceso de decisi&oacute;n.   Tuckey coment&oacute; en 1991, seg&uacute;n   cita Cohen (11): "Es tonto preguntar:   "¿Los efectos A y B son diferentes?".   &Eacute;stos son siempre diferentes en alg&uacute;n   lugar decimal" y siempre es posible   encontrar un tama&ntilde;o de muestra lo   suficientemente grande, que haga   significativa esa diferencia.</p>     <p>   Sup&oacute;ngase que se desea comparar   la talla de dos grupos de   personas (A y B). En cada grupo   se toman 15 personas al azar: en   el A se obtiene una media de 178   cm, con una desviaci&oacute;n est&aacute;ndar   de 2 cm, y en el B, una media de   180 cm, con la misma desviaci&oacute;n   est&aacute;ndar. Aplicando la prueba de   comparaci&oacute;n de medias se obtiene   p = 0,0053; aplicando el proceso   usual de decisi&oacute;n con un umbral   de 0,05 habr&iacute;a que concluir que se   rechaza la igualdad de las medias   de los dos grupos; se aceptar&iacute;a, seg&uacute;n   el an&aacute;lisis estad&iacute;stico, que las   dos medias son "significativamente   diferentes", pero el investigador,   que tiene algunas posiciones en el   problema, tiene otras ideas respecto   al resultado estad&iacute;stico:</p>     <p>   Observando cr&iacute;ticamente el resultado   obtenido, la pregunta ser&iacute;a:   &iquest;hasta qu&eacute; punto 2 cm identifican,   en promedio, una diferencia de   estatura relevante desde el punto   de vista no s&oacute;lo num&eacute;rico, que es   lo que se obtuvo con el an&aacute;lisis anterior, sino tambi&eacute;n biol&oacute;gico?   Pensando l&oacute;gicamente, se esperar&iacute;a   que el an&aacute;lisis considerara, de alguna   forma, el hecho de que 2 cm no   marcan una diferencia relevante en   las tallas, pero el procedimiento de   an&aacute;lisis empleado fue gen&eacute;rico, no   tuvo en cuenta las peculiaridades de   la medici&oacute;n analizada; de hecho, es   el mismo que los textos de estad&iacute;stica   sugieren para todas las &aacute;reas   del conocimiento, sin excepciones y   sin tener en cuenta sus especificidades.   Luego, el an&aacute;lisis no incorpor&oacute;   ning&uacute;n elemento de la biolog&iacute;a del   problema que se est&aacute; abordando.   En esta generalidad est&aacute;, justamente,   la insuficiencia del an&aacute;lisis que   se hizo. Este punto ser&aacute; discutido   posteriormente.</p>     <p>   Sup&oacute;ngase que al discutir los   resultados de ese an&aacute;lisis, usted,   como investigador(a), tiene antecedentes   de otros estudios, acerca de   que en este problema no se espera   que la estatura cambie al comparar   los grupos; por otra parte, usted ve   que 2 cm no marcan diferencias entre   los grupos, aunque se lo diga la   estad&iacute;stica, y, por &uacute;ltimo, dise&ntilde;&oacute; el   estudio con la fuerte convicci&oacute;n de   que no iba a encontrar diferencias.   Si se fueran a interpretar las   conclusiones obtenidas, tal como las   discuten algunos investigadores, utilizando   la "plausibilidad biol&oacute;gica",   se dir&iacute;a: "esta diferencia, significativa   seg&uacute;n la estad&iacute;stica, no es relevante   cl&iacute;nicamente, est&aacute; demostrado que lo   que se comprara no cambia la estatura   pues se sabe que ...". En consecuencia,   no se asume la diferencia entre las tallas de los grupos, encontrada   con los m&eacute;todos estad&iacute;sticos;   para justificar esta arbitrariedad se   utilizan argumentos pseudoestad&iacute;sticos,   como: "si se hubiera dispuesto   de un mayor tama&ntilde;o de muestra se   hubiera tenido un menor efecto del   azar y no se hubieran encontrado   diferencias".</p>     <p>   Pero esta forma de proceder,   por subjetiva, es absolutamente incorrecta,   un an&aacute;lisis de este tipo no   ser&iacute;a objetivo, aunque se presente   muy frecuentemente. Proceder as&iacute;   no es deseable. Cuando se introdujeron   las pruebas de hip&oacute;tesis, a   principios del siglo XX, la necesidad   de su uso se deriv&oacute; del imperativo   de eliminar el subjetivismo y los   matices anecd&oacute;ticos, que predominaban   en las publicaciones cient&iacute;ficas;   la forma de proceder que se   ilustra constituye un retroceso a ese   momento. Sin embargo, la inconsistencia   de la estad&iacute;stica es evidente;   &iquest;qu&eacute; es lo que no funciona bien?</p>     <p>   La b&uacute;squeda de un camino   para un an&aacute;lisis de datos que sea   metodol&oacute;gicamente correcto debe   tener en cuenta la causa del error,   y aquel estuvo en el procedimiento   de comparaci&oacute;n que se emple&oacute;: la   metodolog&iacute;a utilizada para el an&aacute;lisis   de los datos no es razonable   en el marco del significado de la   medici&oacute;n, porque no responde al   inter&eacute;s del an&aacute;lisis visto este en   el contexto de las caracter&iacute;sticas   biol&oacute;gicas de la variaci&oacute;n de la medici&oacute;n:   estad&iacute;stica y significaci&oacute;n   biol&oacute;gica no aparecieron integrando   conjuntamente el procedimiento de an&aacute;lisis utilizado, fueron utilizadas   como dos componentes aislados.   &iquest;C&oacute;mo proceder?, &iquest;c&oacute;mo integrar   dos elementos tan diferentes?</p>     <p>   Lo que se propone para recuperar   la objetividad es introducir hip&oacute;tesis   que combinen la formulaci&oacute;n   estad&iacute;stica y la biolog&iacute;a o cl&iacute;nica del   problema. Para ello, las hip&oacute;tesis   estad&iacute;sticas deber&iacute;an permitir que   se identifiquen cambios s&oacute;lo si estos   son biol&oacute;gicamente relevantes: la   respuesta se encuentra en los ensayos   de equivalencia, superioridad e   inferioridad; concretamente, en las   hip&oacute;tesis que se someten a evaluaci&oacute;n   en ellos. Por supuesto, dicha   propuesta ser&aacute; &uacute;til en la medida en   que el dise&ntilde;o del estudio garantice   que el tama&ntilde;o de muestra permita   abordar las comparaciones de inter&eacute;s   con la potencia considerada a priori.</p>     <p>   Para formular hip&oacute;tesis que   tengan en cuenta la biolog&iacute;a del   problema o aspectos de costo, beneficio   u oportunidad, es necesario   identificar un valor umbral, d, que   identifique un rango que marque   la aceptabilidad cl&iacute;nica o biol&oacute;gica   de las diferencias o las semejanzas.   Es decir, identificar un valor que   marque la diferencia m&iacute;nima que   ser&iacute;a cl&iacute;nicamente relevante. En ese   caso, el valor de umbral identificar&iacute;a   diferencias relevantes solamente si   son mayores o menores que &eacute;l.</p>     <p>   Por ejemplo, en un estudio   para evaluar la efectividad de un   nuevo tratamiento, el X sobre la W   como antipsic&oacute;ticos, se realiz&oacute; la   comparaci&oacute;n entre los tratamientos,   de manera que para aceptar el   nuevo producto bastar&iacute;a con que   sus porcentaje de &eacute;xitos no fueran   inferiores a los de la Y en un 2%; es   decir, aunque Y es superior al W, si   esta superioridad no sobrepasa un   2% se aceptar&iacute;a como relevante el   nuevo producto por sus ventajas.</p>     <p>   Visto el ensayo cl&iacute;nico de la manera   usual, las hip&oacute;tesis ser&iacute;an: H<sub>o</sub>:   P<sub>w</sub> = P<sub>w</sub> contra la alternativa H<sub>A</sub>: P<sub>x</sub>   &ne; P<sub>w</sub>, donde P<sub>x</sub> denota el porcentaje   de &eacute;xitos terap&eacute;uticos con X, y P<sub>w</sub>,   el porcentaje de &eacute;xitos con W. Esta   forma de ver el ensayo, aunque es   la usual, no tiene en cuenta que el   nuevo producto tiene tantas ventajas   adicionales que es deseable, aun si es   ligeramente menos eficiente en t&eacute;rminos   terap&eacute;uticos que el tradicional.</p>     ]]></body>
<body><![CDATA[<p>   Considerando el umbral del 2%   como punto central de la aceptaci&oacute;n   del nuevo producto, las hip&oacute;tesis   para el an&aacute;lisis de los datos que integrar&iacute;an   todos los intereses ser&iacute;an:   H<sub>o</sub>: P<sub>w</sub> - P<sub>x</sub> > 2 contra la alternativa   H<sub>A</sub>: P<sub>w</sub> - P<sub>x</sub> &lt; 2. Estas hip&oacute;tesis,    que   se denominan de no inferioridad,   establecen la aceptaci&oacute;n del nuevo   producto incluso si es sobrepasado   en su efectividad por la W, pero si   esta superioridad no es mayor que   el 2%, as&iacute;: aceptar H0 representar&iacute;a   que la W es superior al X en un 2%;   en este caso no es recomendable el   cambio seg&uacute;n lo planteado; aceptar   HA representar&iacute;a que la W no sobrepasa   al X al menos en un 2%, y   esto significar&iacute;a que la W puede ser   superior, pero con superioridad por   debajo del 2%; o sea, que el X es superior,   lo que ser&iacute;a representado por   los valores negativos de la diferencia: en ambos casos, seg&uacute;n lo planteado,   se aconseja sustituir el tratamiento   usual por el nuevo producto, y eso es   lo que establece HA: aceptar el nuevo   producto si es mejor, o si no es "muy   inferior" al usual, seg&uacute;n el valor de   umbral aceptado a priori.</p>     <p>   Como alternativa al planteamiento   de las hip&oacute;tesis de semejanza, que   son las que se analizan usualmente   en los ensayos cl&iacute;nicos y com&uacute;nmente   en los an&aacute;lisis estad&iacute;sticos de los diferentes   problemas, se plantea la necesidad   de sustituirlas por hip&oacute;tesis de   equivalencia, no de inferioridad o de   superioridad (12). Esta nueva formulaci&oacute;n   de las hip&oacute;tesis, que realmente   no es nueva, pues son conocidas por   los estad&iacute;sticos desde hace tiempo,   permitir&aacute; introducir componentes   adicionales en los an&aacute;lisis al vincular   en una sola pieza los aspectos   estad&iacute;sticos y metodol&oacute;gicos que se   identifican a partir de la plausibilidad   biol&oacute;gica o de otras consideraciones,   como ser&iacute;an el costo-beneficio o la   oportunidad. La estructura de tales   hip&oacute;tesis se discute, por ejemplo, en   el texto de Chow (12).</p>     <p>   La b&uacute;squeda de los valores que   marcan los umbrales que definen   las hip&oacute;tesis podr&iacute;a ser compleja,   pues tales valores no siempre est&aacute;n   establecidos (12). En el caso de los   ensayos cl&iacute;nicos, existen algunas   &aacute;reas donde est&aacute;n normados (13),   su determinaci&oacute;n debe ser vista   como una componente fundamental   en la investigaci&oacute;n cl&iacute;nica y todo   parece indicar que es la &uacute;nica forma   de dar sentido cl&iacute;nico al uso de las   pruebas de hip&oacute;tesis.</p>     <p>   La no existencia de valores de   umbral que cuenten con un consenso   bien podr&iacute;a ser una limitaci&oacute;n   para su uso; aunque dichos valores   no siempre est&aacute;n determinados, s&iacute;   se ha establecido que ellos deben   cuantificar el peor caso de p&eacute;rdida   en eficacia que es aceptable cl&iacute;nicamente,   considerando la seguridad   potencial, la conveniencia o las   ventajas del nuevo tratamiento, en   el caso de los ensayos cl&iacute;nicos (13),   o los niveles m&iacute;nimos del comportamiento   de las mediciones que   son biol&oacute;gicamente relevantes para   detectar diferencias.</p>     <p>   La Federal Drug Administration   de Estados Unidos ha establecido   algunas reglas para la identificaci&oacute;n   de los valores de umbral en los ensayos   de equivalencia o no inferioridad   (14,15); ellas combinan consideraciones   estad&iacute;sticas y cl&iacute;nicas.</p>     <p>   En el caso del ejemplo donde se   compar&oacute; la talla de dos grupos de   personas, el valor d ser&iacute;a determinado   por una diferencia en la talla   que identifique una discrepancia en   las tallas que sea relevante al comparar   los grupos en el contexto del   problema abordado. Esto determina   que el valor umbral es contextual;   es decir, relativo al problema: si lo   que se pretende en este caso es ver   si las diferencias de tallas entre los   grupos marca una diferencia en   el estado nutricional, el valor de d   debe detectar ese umbral de cambio   relevante en la talla.</p>     <p>   Seg&uacute;n este criterio, un candidato   para umbral podr&iacute;a ser 8 cm,   pues es la variaci&oacute;n en la talla que identifica un cambio de una unidad   en el &iacute;ndice de masa corporal para   un individuo con un peso promedio   de 70 kg, suponiendo que este fuera   el peso promedio en la poblaci&oacute;n.   Ello significar&iacute;a que son relevantes,   en promedio, diferencias de tallas   por encima de d = 8 cm. En ese caso,   la hip&oacute;tesis nula ser&iacute;a H<sub>o</sub>: &micro;<sub>B</sub> - &micro;<sub>A</sub>   &le; 8,   lo cual significa que diferencias que   no sean significativamente superiores   a 8 cm no son relevantes en el   problema. En ese caso, rechazar H<sub>o</sub>   s&iacute; significar&iacute;a una decisi&oacute;n de cambio   nutricionalmente relevante.</p>     <p>   Ante la dificultad de identificar   el valor de umbral, se propone   una alternativa gr&aacute;fica para el   an&aacute;lisis. Esta alternativa parte de   considerar diferentes valores de d,   realizar la prueba de hip&oacute;tesis correspondiente   y calcular el valor p   correspondiente. La <a href="#f1">Figura 1</a> parte   de considerar la variaci&oacute;n del valor   p como funci&oacute;n de d. En los casos   en que no est&eacute; determinado un valor   de umbral para la identificaci&oacute;n de   cambios biol&oacute;gicamente relevantes,   es recomendable construir un gr&aacute;fico   de ese tipo para identificar a partir   de qu&eacute; valor de las diferencias, o   sea, para qu&eacute; umbral, se aceptar&iacute;a o   rechazar&iacute;a la hip&oacute;tesis del cambio:   de esta manera se podr&iacute;a mejorar   la calidad del an&aacute;lisis de los datos   y obtener conclusiones m&aacute;s objetivas   y con un componente biol&oacute;gico   intr&iacute;nseco.</p>       <p>    <center><a name="f1"><img src="img/revistas/rcp/v38n3/v38n3a13f1.gif"></a></center></p>     ]]></body>
<body><![CDATA[<p>   <a href="#f1">La Figura 1</a> muestra la relevancia   que tendr&iacute;a el valor d en el   proceso de inferencia del ejemplo.   Para valores   de d &gt; 1 cm el valor p   que se observar&iacute;a ser&iacute;a mayor que   0,01, lo que indicar&iacute;a el no rechazo   de H<sub>o</sub>: &micro;<sub>B</sub> - &micro;<sub>A</sub>   &lt; d. Bastar&iacute;a con considerar   un valor m&iacute;nimo de 1cm   como umbral para la relevancia de   las diferencias de talla, para que   cambie la conclusi&oacute;n a que se arrib&oacute;   en el ejemplo con el cual se mostr&oacute;,   anteriormente, la forma de proceder   en el an&aacute;lisis estad&iacute;stico habitual.</p>     <p>De esta forma queda clara la irrelevancia   de las diferencias que se   encontraron entre los grupos, y se   hace evidente lo inadecuado de buscar   diferencias significativas como   criterio de an&aacute;lisis de los datos en   algunos problemas.</p>     <p>   <b><font size="3">Referencias</font></b></p>     <!-- ref --><p>   1. Monterrey P, G&oacute;mez-Restrepo C. Aplicaci&oacute;n   de las pruebas de hip&oacute;tesis en   la investigaci&oacute;n en salud. &iquest;Estamos   en lo correcto? Universitas M&eacute;dica.   2007;48(3):193-206.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000076&pid=S0034-7450200900030001300001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   2. International Comitee of Medical Journal   Editors. Uniform requirements for   manuscript submitted to biomedical journals.   Br Med J. 1997;33 6(4):309-15.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000077&pid=S0034-7450200900030001300002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   3. Jonson D. The insignificance of statistical   significance testing. Journal of Wildlife   management. 1999;63(3):763-72.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000078&pid=S0034-7450200900030001300003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   4. Fleiss JL. Significance test have a   role in epidemiologic research: reactions   to AM Walker. Am J Pub Health.   1986;76(5):559-60.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000079&pid=S0034-7450200900030001300004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   5. Gliner J, Leech N, Morgan G. Problems   with null hypothesis significance   testing (NHST): what do the textbooks   say? The Journal of the Experimental   Education. 2002;71(1):83-92.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000080&pid=S0034-7450200900030001300005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   6. Polit DF, Hungler BP. Investigaci&oacute;n cient&iacute;fica   en ciencias de la salud. Principios   y m&eacute;todos. Mexico: McGraw-Hill Interamericana,   HealthCare Group; 2000.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000081&pid=S0034-7450200900030001300006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   7. Weinberg C. It&acute;s time to rehabilitate the   P-Value. Epidemiology. 2001;12(3):288-   90.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000082&pid=S0034-7450200900030001300007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   8. Sterne JA, Davie Smith GD. Sifting the   evidence-what&acute;s wrong with significance   tests? Br Med J. 2001;322(7280):226-   31 .&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000083&pid=S0034-7450200900030001300008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   9. Daniell W. Bioestad&iacute;stica. Base para   el an&aacute;lisis de las ciencias de la salud.   M&eacute;xico: Limusa; 2002.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000084&pid=S0034-7450200900030001300009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   10. Pagano M, Gauvreau K. Fundamentos   de bioestad&iacute;stica. M&eacute;xico: Thomson   Learning; 2001.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000085&pid=S0034-7450200900030001300010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   11 . Cohen J. The earth is Round (p&lt;.05)   American Psychologist. 1994;49(12):997-   1003.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000086&pid=S0034-7450200900030001300011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   12. Chow S, Shao J, Wang H. Sample size   calculations in clinical research. New   York: Marcel Dekker; 2003.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000087&pid=S0034-7450200900030001300012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   13. Kaul S, Diamon G, Weintraub W. Trials   and tribulations of non-inferiority: The   ximelagatran experience [Internet].   San Diego: J Am Coll Cardiol; 2005   Nov; [2009 jun 20]. Disponible en:   <a href="http://content.onlinejacc.org/cgi/reprint/j.jacc.2005.07.062v1.pdf" target="blank">http://content.onlinejacc.org/cgi/reprint/j.jacc.2005.07.062v1.pdf</a>.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000088&pid=S0034-7450200900030001300013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   14. International Conference on Harmonisation.   Statistical principles for clinical   trials (ICH E9). 1998, Feb 5 [2009 jun   20]. Disponible en: <a href="http://www.ich.org/LOB/media/MEDIA485.pdf" target="blank">http://www.ich.org/LOB/media/MEDIA485.pdf</a>.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000089&pid=S0034-7450200900030001300014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>   15. International Conference on Harmonisation.   Guidance on choice of control   group and related design and conduct   issues in clinical trials (ICH E 10). Federal   Register, 2000 Jul 20 [2009 jun   20]. Disponible en: <a href="http://www.ich.org/LOB/media/MEDIA486.pdf" target="blank">http://www.ich.org/LOB/media/MEDIA486.pdf</a>.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000090&pid=S0034-7450200900030001300015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p>   Conflictos de inter&eacute;s: los autores manifestamos que no   tenemos ning&uacute;n conflicto de inter&eacute;s en este art&iacute;culo.</p> </font>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Monterrey]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Gómez-Restrepo]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Aplicación de las pruebas de hipótesis en la investigación en salud. ¿Estamos en lo correcto?]]></article-title>
<source><![CDATA[Universitas Médica]]></source>
<year>2007</year>
<volume>48</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>193-206</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<collab>International Comitee of Medical Journal Editors</collab>
<article-title xml:lang="en"><![CDATA[Uniform requirements for manuscript submitted to biomedical journals]]></article-title>
<source><![CDATA[Br Med J]]></source>
<year>1997</year>
<volume>33 6</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>309-15</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jonson]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The insignificance of statistical significance testing]]></article-title>
<source><![CDATA[Journal of Wildlife management]]></source>
<year>1999</year>
<volume>63</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>763-72</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fleiss]]></surname>
<given-names><![CDATA[JL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Significance test have a role in epidemiologic research: reactions to AM Walker]]></article-title>
<source><![CDATA[Am J Pub Health]]></source>
<year>1986</year>
<volume>76</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>559-60</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gliner]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Leech]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Morgan]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Problems with null hypothesis significance testing (NHST): what do the textbooks say?]]></article-title>
<source><![CDATA[The Journal of the Experimental Education]]></source>
<year>2002</year>
<volume>71</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>83-92</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Polit]]></surname>
<given-names><![CDATA[DF]]></given-names>
</name>
<name>
<surname><![CDATA[Hungler]]></surname>
<given-names><![CDATA[BP]]></given-names>
</name>
</person-group>
<source><![CDATA[Investigación científica en ciencias de la salud: Principios y métodos]]></source>
<year>2000</year>
<publisher-loc><![CDATA[Mexico ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill Interamericana, HealthCare Group]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Weinberg]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[It&acute;s time to rehabilitate the P-Value]]></article-title>
<source><![CDATA[Epidemiology]]></source>
<year>2001</year>
<volume>12</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>288- 90</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sterne]]></surname>
<given-names><![CDATA[JA]]></given-names>
</name>
<name>
<surname><![CDATA[Davie Smith]]></surname>
<given-names><![CDATA[GD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sifting the evidence-what&acute;s wrong with significance tests?]]></article-title>
<source><![CDATA[Br Med J]]></source>
<year>2001</year>
<volume>322</volume>
<numero>7280</numero>
<issue>7280</issue>
<page-range>226- 31</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Daniell]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<source><![CDATA[Bioestadística: Base para el análisis de las ciencias de la salud]]></source>
<year>2002</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Limusa]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pagano]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Gauvreau]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[Fundamentos de bioestadística]]></source>
<year>2001</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Thomson Learning]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cohen]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[The earth is Round (p<.05)]]></article-title>
<source><![CDATA[American Psychologist]]></source>
<year>1994</year>
<volume>49</volume>
<numero>12</numero>
<issue>12</issue>
<page-range>997- 1003</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chow]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Shao]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Sample size calculations in clinical research]]></source>
<year>2003</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Marcel Dekker]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kaul]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Diamon]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Weintraub]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<source><![CDATA[Trials and tribulations of non-inferiority: The ximelagatran experience]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="">
<collab>International Conference on Harmonisation</collab>
<source><![CDATA[Statistical principles for clinical trials (ICH E9). 1998, Feb 5]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="">
<collab>International Conference on Harmonisation</collab>
<source><![CDATA[Guidance on choice of control group and related design and conduct issues in clinical trials (ICH E 10)]]></source>
<year></year>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
