SciELO - Scientific Electronic Library Online

 
vol.26 número3The beginning of Nephrology in Colombia as seen by pioneer nephrologist Jaime Borrero Ramírez índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Em processo de indexaçãoCitado por Google
  • Não possue artigos similaresSimilares em SciELO
  • Em processo de indexaçãoSimilares em Google

Compartilhar


Iatreia

versão impressa ISSN 0121-0793

Iatreia vol.26 no.3 Medellín jul./set. 2013

 

ACTUALIZACIÓN CRÍTICA

 

Ronda clínica y epidemiológica Uso de variables instrumentales en investigación médica

 

 

Ana María Muñoz1; Nelson Darío Giraldo2; Fabián Jaimes3

 

1 MD. Profesora del Instituto de Investigaciones Médicas, Universidad de Antioquia, Medellín, Colombia.

2 MD. Especialista en Medicina de Cuidado Intensivo, Hospital Pablo Tobón Uribe, Medellín Colombia.

3 MD., MSc., PhD., Profesor de Medicina Interna y Epidemiología Clínica, Universidad de Antioquia. Investigador, Unidad de Investigaciones, Hospital Pablo Tobón Uribe, Medellín, Colombia. fjaimes@udea.edu.co; fjaimesb@jhsph.edu

 

 

Recibido: abril 29 de 2013
Aprobado: mayo 07 de 2013

 

 


 

 

INTRODUCCIÓN

El papel de la epidemiología, en el contexto del proceso de salud-enfermedad, es dilucidar la relación causal entre uno o más factores de exposición y un resultado o evento de interés. Los criterios de causalidad sugeridos por Sir Austin Bradford Hill se plantearon como una serie de condiciones o requisitos que, en conjunto, sirven para diferenciar la simple asociación de la verdadera causalidad (1): 1) la fuerza de la asociación entre el factor de riesgo y la enfermedad; 2) la consistencia, es decir, que la asociación debe estar sustentada también en otras investigaciones; 3) la especificidad, es decir, el límite de dicha asociación para tipos particulares de exposiciones y desenlaces; 4) que el factor de riesgo anteceda la enfermedad; 5) el gradiente biológico, es decir, una relación clara dosis-respuesta; 6) la plausibilidad biológica; 7) la coherencia, es decir, que no aparezca un conflicto extremo con lo que se conoce de la biología y la historia natural de una enfermedad; 8) la evidencia experimental de reversibilidad o atenuación del efecto si se retira la exposición; y 9) la analogía con otras asociaciones o explicaciones biológicas conocidas y aceptadas como válidas.

Para resolver las preguntas relevantes acerca de la existencia de una relación causal, los epidemiólogos e investigadores médicos acudimos a los estudios experimentales en humanos, es decir, los ensayos clínicos controlados con asignación aleatoria (ECC) como el estándar de oro de los diseños de investigación. Cuando no es posible el ECC por razones económicas, éticas, prácticas u otras, la alternativa son los estudios no experimentales como los de cohorte o de casos y controles, aunque los estudios no experimentales como los de cohorte pueden sobredimensionar el efecto de un factor o exposición hasta en un 40% (2); un trabajo que comparó los resultados de los estudios no experimentales con los de los ECC encontró que de 136 estudios acerca de 19 intervenciones, solo dos de estas tenían diferencias en el efecto en las que el valor del mismo en los estudios no experimentales estaba por fuera del intervalo de confianza del 95% encontrado en los ECC (3). Si bien esta aproximación ''observacional'' puede ser apropiada en la mayoría de los contextos, el problema inmediato que surge para obtener resultados válidos de investigación es la necesidad de controlar los sesgos o errores sistemáticos en los estudios no experimentales. Los sesgos pueden ocurrir al seleccionar la población de estudio, al recolectar y medir la información necesaria para el análisis y, finalmente, en la presencia de factores o variables que confunden la verdadera relación entre una exposición y un desenlace.

Un fenómeno relativamente común en los estudios no experimentales, cuando buscan evaluar el efecto de un tratamiento, es la frecuencia con que puede ocurrir el sesgo de selección, ya que la decisión de dar un tipo particular de tratamiento frecuentemente está relacionada con la gravedad y el pronóstico de la enfermedad, además de ciertas variables económicas y sociales. El otro y probablemente más grave problema es la presencia de variables de confusión que pueden distorsionar la relación causal y el efecto real de la intervención. Por tanto, los métodos para controlar la confusión y los errores de medición son particularmente importantes en este tipo de estudios. Entre estos métodos, las técnicas estadísticas y epidemiológicas usuales como los análisis multivariados pueden hacer un ajuste por las variables de confusión medidas, y de este modo encontrar una medida de efecto probablemente bastante cercana a la ''verdadera'' asociación. No obstante, estas técnicas clásicas no tienen la posibilidad de hacer ajustes por las posibles variables de confusión que no fueron medidas o que lo fueron de manera incompleta, un fenómeno denominado confusión residual. En un intento por ''imitar'' a los ECC ha surgido la propuesta de utilizar una variable diferente, ''externa'' o instrumental, la cual logre que todas las variables preexposición medidas y no medidas queden balanceadas entre ambos grupos: los expuestos y los no expuestos a la intervención o exposición. Esta aproximación a la inferencia causal con una variable instrumental tiene la inmensa potencialidad de controlar la confusión residual (4,5).

 

HISTORIA Y DEFINICIONES

El método de variables instrumentales (VI) para el control de los factores de confusión y errores de medición en la investigación data de 1920, aproximadamente; desde entonces su uso hace parte de las ciencias econométricas, pero en las ciencias de la salud y en la investigación médica se utiliza con mayor frecuencia apenas en las últimas décadas (5). Este método se basa en el supuesto de la existencia de una variable o ''instrumento'' que se asocia con la exposición de interés pero no con el desenlace y que por tanto cumple las siguientes características (figura 1) (5,6).

La variable instrumental (C) está relacionada con el factor de exposición (A).

La variable instrumental (C) tiene una predicción significativa del factor de exposición (A).

La variable instrumental (C) no está relacionada directamente con el desenlace (B), solo lo hace a través de su relación con el factor de exposición (A).

La variable instrumental (C) es independiente de los factores de confusión conocidos o no conocidos (D), y no está asociada al desenlace (B) a través de esos factores.

El concepto estadístico sobre el que se sustenta este método es que las variables instrumentales y el error asociado a la ecuación lineal básica son ortogonales en la población, es decir, que no comparten sus varianzas y no necesitan clasificarse como dependientes o independientes; y por tanto se puede considerar el método de VI como un caso especial de la teoría general de Métodos Generalizados de Momentos (Generalized Method of Moments: GMM) (7,8). También, en su contexto original de la econometría, los modelos de VI se han considerado como una parte de los sistemas de ecuaciones simultáneas denominados clásicamente Modelos de Ecuaciones Estructurales (Structural Equation Models: SEM) (9).

En la regresión lineal convencional, el sencillo método de estimación basado en mínimos cuadrados nos permite obtener los valores de los coeficientes que mejor representan la ecuación, llamados clásicamente el intercepto y la pendiente -o el intercepto y los coeficientes de regresión para los casos de múltiples variables independientes-. Para el análisis con el método de VI, en su forma más simple, se utiliza una estimación por medio de mínimos cuadrados de dos etapas: primero se hace una regresión de la variable explicativa o factor de exposición (A) en la variable instrumental (C) y otras variables de confusión (D) para obtener unos valores ajustados de A. Es decir, se estima o ''predice'' el valor ajustado que ''debería'' tener esa exposición (A) con base en los datos disponibles. Luego se hace una regresión del desenlace (B) en los valores ajustados de A y en ciertos casos en los mismos factores de confusión (D), es decir, una estimación o predicción del resultado (B) con base en los valores ''corregidos'' de la exposición (A) (10).

 

UTILIDAD

Control de factores de confusión

Los estudios observacionales, como se explicó previamente, tienen como principal propósito la identificación de factores de riesgo o pronóstico en relación con un desenlace de interés; y tienen utilidad en situaciones en las que no es posible técnica o éticamente el desarrollo de ensayos clínicos controlados de asignación aleatoria (3). En la práctica clínica pueden existir múltiples variables conocidas o desconocidas que influencian la relación entre el factor evaluado y el desenlace (11). Las variables instrumentales son uno de los métodos desarrollados para controlar el efecto de los factores de confusión, medidos o no, simulando el efecto del azar en la asignación aleatoria de los ensayos clínicos (12).

Ensayos clínicos controlados de asignación aleatoria

En los ensayos clínicos no existe el problema de los factores de confusión ya que la estrategia de la asignación aleatoria, complementada por el enmascaramiento, hace que tanto los factores de confusión conocidos como los desconocidos queden equilibrados en los grupos de estudio. Sin embargo, en estos estudios se presenta con frecuencia el fenómeno de no adherencia o no cumplimiento con la intervención en estudio por parte de algunos participantes. Ante este problema, la recomendación clásica es el análisis por intención de tratar, en el cual se comparan los resultados de los grupos de individuos asignados al tratamiento o al control sin tener en cuenta si efectivamente recibieron la intervención. Los críticos de esta recomendación señalan que el tratamiento recibido verdaderamente es la única fuente real de la eficacia biológica, y que el análisis por intención de tratar no solamente muestra resultados inexactos con respecto al verdadero efecto de la intervención, sino que esa inexactitud no necesariamente ocurre siempre en la misma dirección de dilución o disminución del efecto. Al considerar la simple asignación del tratamiento por medio de un método aleatorio como una variable instrumental (C), es posible utilizar el método de VI para conocer el efecto ''real'' del tratamiento recibido (A) en el desenlace (B) del ECC (figura 2) (5).

 

ALTERNATIVAS, VENTAJAS Y DESVENTAJAS CON OTRAS ESTRATEGIAS

Existen otras alternativas para el manejo de los factores de confusión en el análisis de los estudios observacionales, además de las clásicas técnicas de ajuste por múltiples variables, por ejemplo, el método de puntuación de propensión (propensity score) que fue discutido en un número anterior de la ronda clínica y epidemiológica (13). Dicho método busca ajustar la exposición a los diversos factores de confusión de acuerdo con la probabilidad, estimada de diversas formas, de que un sujeto recibiera determinada exposición o intervención. Tanto en este como en los métodos convencionales de regresión con múltiples variables o análisis multivariados, se tienen en cuenta solamente aquellas variables de confusión conocidas y medidas. Esto contrasta con el modelo de VI, en el cual es potencialmente posible el control también por las variables de confusión desconocidas o no medidas (11) De esta misma ventaja se desprende también la principal limitación del método: no es posible verificar estadísticamente todos los supuestos o características que se mencionaron previamente para la VI (relacionada con la exposición, pero no directamente relacionada con el desenlace, independiente de los factores de confusión conocidos o no conocidos, y con una predicción significativa del factor de exposición). La posibilidad de identificar una variable instrumental válida depende fundamentalmente del conocimiento y el raciocinio médico y epidemiológico, y ocasionalmente también de alguna evaluación empírica de la variable propuesta; pero no es posible obtener la certeza de contar con una VI por medio de alguna prueba estadística (14).

 

EJEMPLOS DE VARIABLES INSTRUMENTALES EN EPIDEMIOLOGÍA CLÍNICA

Para ilustrar el uso de una variable instrumental como método para controlar factores de confusión desconocidos, tomamos de la literatura un ejemplo acerca de la atención y el manejo de los pacientes con infarto agudo de miocardio (IAM) (12). Específicamente, se quiere evaluar o determinar el desenlace de mortalidad en relación con el uso de cateterismo cardíaco por medio de un estudio de cohorte (figura 3). Cuando se hace la evaluación inicial del efecto de la intervención, se observa una diferencia en el riesgo de muerte de 0,150 (tabla 1). Sin embargo, por la naturaleza no experimental del estudio, se espera encontrar numerosos factores de confusión dados por las características de la comorbilidad de los individuos que impiden estimar la verdadera magnitud del efecto. Es decir, el cateterismo puede ser realmente más eficaz que otra alternativa, o el efecto observado puede ser el resultado de que los pacientes sometidos a cateterismo se seleccionan para dicho procedimiento por sus mejores condiciones y menor riesgo de muerte. En esta situación, la distancia entre la vivienda del paciente o el sitio de ocurrencia del IAM y el centro de referencia más cercano donde se pueda hacer el cateterismo cardíaco cumpliría intuitivamente, al menos en parte, los requisitos más importantes para ser una variable instrumental.

Si se reemplazara en la comparación la variable de intervención por la respectiva VI, es decir, ''cateterismo'' por ''distancia corta'' y ''no cateterismo'' por ''distancia larga'', teóricamente se removería el efecto de las variables de confusión relacionadas con la indicación del procedimiento por medio de ese mecanismo de ''seudoasignación'' aleatoria al sitio de ocurrencia del IAM. Nótese que este ''reemplazo'' cambia la dirección del efecto hacia un valor negativo (tabla 2). Esta estimación del efecto, sin embargo, puede estar diluida o parcialmente borrada porque en un número significativo de pacientes esa distancia al centro de referencia no fue el factor fundamental que determinó la realización del cateterismo. Esta asociación entre la VI y la verdadera exposición, denominada ''fuerza de la variable instrumental'', se muestra en la tabla 3. Para lograr la estimación completa del efecto, por tanto, es necesario ajustar la asociación de la VI con el desenlace (tabla 2) por la fuerza de dicha VI (tabla 3). Para lo anterior, se tiene en cuenta la fórmula de la figura 3, en la que el numerador corresponde a la relación entre la variable instrumental y el desenlace y el denominador corresponde a la fuerza de la variable instrumental la cual se evalúa por medio de su relación con el factor de exposición o cateterismo. Este ejemplo simplifica e ilustra la estimación más básica del efecto con medidas de riesgo absoluto, es decir, la diferencia de riesgos; pero en la mayoría de los casos se necesitan medidas de riesgo multiplicativas como los riesgos relativos que requieren modelos del tipo de mínimos cuadrados de dos etapas que se mencionó anteriormente.

Hay numerosos ejemplos en la literatura médica y epidemiológica reciente del uso de VI en investigación; uno de los que cuentan con más publicaciones es el análisis de asignación aleatoria ''Mendeliana'' (14-18). Este análisis se utiliza desde 1986 en la investigación básica y clínica, y como VI se utiliza un gen específico para evaluar la relación entre su fenotipo derivado y la aparición de enfermedad en presencia de variables de confusión (17). En este caso la VI, es decir, la variante genética, tiene relación con la enfermedad exclusivamente por intermedio del fenotipo que dicho gen induce, y ese genotipo viene a su vez asignado de forma ''aleatoria'' desde el nacimiento (16). Otros ejemplos de asignación aleatoria ''Mendeliana'' se han presentado para analizar la asociación entre el sistema del péptido natriurético atrial y la ocurrencia de diabetes de tipo 2 (15), los niveles de fibrinógeno y la ocurrencia de enfermedad coronaria (18), y los niveles de homocisteína con respecto a la aparición de enfermedad cerebrovascular (19). En otros contextos diferentes, se ha evaluado la mortalidad intrahospitalaria en recién nacidos de muy bajo peso al nacer de acuerdo con el volumen anual de atención hospitalaria, utilizando como VI la distancia al hospital (20); en la mortalidad de los pacientes sometidos a cistectomía y prostatectomía radical en relación con el volumen de pacientes atendidos en el hospital, determinando la relación entre la curva de aprendizaje del procedimiento y su aplicación de forma repetida y el desenlace favorable de los pacientes, utilizando como VI la remisión selectiva de los pacientes a estos centros (21); y en pacientes con infección por virus de inmunodeficiencia humana (VIH) en la evaluación del avance a síndrome de inmunodeficiencia adquirida (sida) de acuerdo con el uso de terapia antirretroviral altamente activa (HAART, por su sigla en inglés), utilizando como VI el ''período calendario'' antes y después de la aparición de la terapia (22).

Uso de VI en paquetes estadísticos

En el paquete estadístico STATA se puede hacer el análisis de variables instrumentales con el comando ivregress, con el cual se hace la regresión lineal en dos etapas: primero la relación de la variable de exposición con la variable instrumental, y luego, la variable exposición con la variable de resultado. A continuación mostraremos el ejemplo que ofrece el manual de referencia del programa y que se puede complementar en diversas páginas electrónicas de acceso libre (http://www.stata.com/support/faqs/statistics/instrumental-variables-regression/ ; http://www.ats.ucla.edu/stat/stata/examples/eacspd/chapter5.htm). La base de datos corresponde al censo americano de 1980 y se quiere ver la relación que hay entre la renta bruta mensual como variable dependiente (rent) y el valor medio en dólares de las casas propias (hsngval) como variable independiente principal. El porcentaje de población urbana en el estado (pcturban) se considera una variable de confusión y las variables instrumentales, es decir, las que pueden predecir completamente la variable hsngval, son el ingreso promedio por familia (faminc) y la región del país medida como variable indicadora o ''dummy'' (i.region) (8). Luego de abrir la base de datos (1.), se corre el modelo con el siguiente conjunto de comandos (2.):

Se observa que el modelo tiene un ajuste aceptable, dado por un R2 = 0,5989, y que la variable que mide el valor promedio de la vivienda (hsngval), determinada en este caso por intermedio de las variables instrumentales, tiene una relación lineal y estadísticamente significativa con la renta bruta mensual (rent). A continuación, se corrobora si la(s) variable(s) instrumental(es) está(n) suficientemente correlacionadas con la exposición (hsngval) (3.):

El estadístico R2 es relativamente alto (0,6908), lo cual es un indicio de que la variable instrumental es adecuada. Además, el estadístico F está por encima del valor umbral de 10 que es el límite tradicionalmente recomendado. Para este ejemplo, sin embargo, se rechazaría la hipótesis nula que dice que la variable instrumental es débil con un límite de sesgo relativo del 10% con respeto al estimador obtenido por el método de mínimos cuadrados ordinarios, porque el estadístico F de 13,30 es mayor que el umbral de 10,27; pero no se podría rechazarla con un límite del 5%, porque el valor umbral en este caso es mayor (16,85 > 13,30). Los comandos ''estat endogenous'' y ''estat overid'' pueden ser útiles para detectar y analizar algunas restricciones adicionales.

 

CONCLUSIONES

Los estudios observacionales o no experimentales pueden suministrar evidencia complementaria a la producida por los ensayos clínicos controlados, y pueden ser incluso muy útiles en términos de la evidencia disponible cuando estos últimos no pueden realizarse. Sin embargo, la estimación del efecto en los estudios observacionales puede ser muy inexacta por la presencia de sesgos de selección y variables de confusión no medidas. Los métodos de análisis con variables instrumentales pueden ser una técnica estadística de gran utilidad en la investigación médica y epidemiológica; y nos pueden ayudar, a pesar de sus reconocidas limitaciones, a dilucidar la ''verdadera'' asociación entre una exposición y un desenlace.

 

REFERENCIAS BIBLIOGRÁFICAS

1. HILL AB. The environment and disease: association or causation? Proc R Soc Med. 1965 May;58:295–300.         [ Links ]

2. Sacks H, Chalmers TC, Smith H. Randomized versus historical controls for clinical trials. Am J Med. 1982 Feb;72(2):233–40.         [ Links ]

3. Benson K, Hartz AJ. A comparison of observational studies and randomized, controlled trials. N Engl J Med. 2000 Jun 22;342(25):1878–86.         [ Links ]

4. Fang G, Brooks JM, Chrischilles EA. Comparison of instrumental variable analysis using a new instrument with risk adjustment methods to reduce confounding by indication. Am J Epidemiol. 2012 Jun 1;175(11):1142–51.         [ Links ]

5. Greenland S. An introduction to instrumental variables for epidemiologists. Int J Epidemiol. 2000 Aug;29(4):722–9.         [ Links ]

6. Pirracchio R, Sprung C, Payen D, Chevret S. Benefits of ICU admission in critically ill patients: whether instrumental variable methods or propensity scores should be used. BMC Med Res Methodol. 2011 Jan;11:132.         [ Links ]

7. Baum CF, Schaffer ME, Stillman S. Enhanced routines for instrumental variables/generalized method of moments estimation and testing. The Stata Journal. 2007;7(4):465–506.         [ Links ]

8. Baum CF, Schaffer ME, Stillman S. Instrumental variables and GMM: Estimation and testing. The Stata Journal. 2003;3(3):1–31.         [ Links ]

9. Rassen JA, Schneeweiss S, Glynn RJ, Mittleman MA, Brookhart MA. Instrumental variable analysis for estimation of treatment effects with dichotomous outcomes. Am J Epidemiol. 2009 Feb 1;169(3):273–84.         [ Links ]

10. McFadden D. Instrumental variables. Economics 240B econometrics/statistics (pp. 1-19). Berkeley: University of California. Retrieved from http://emlab.berkeley.edu/~mcfadden/e240b_f01/ch4.pdf         [ Links ]

11. Fang G, Brooks JM, Chrischilles EA. Apples and oranges? Interpretations of risk adjustment and instrumental variable estimates of intended treatment effects using observational data. Am J Epidemiol. 2012 Jan 1;175(1):60–5.         [ Links ]

12. Rassen JA, Brookhart MA, Glynn RJ, Mittleman MA, Schneeweiss S. Instrumental variables I: instrumental variables exploit natural variation in nonexperimental data to estimate causal relationships. J Clin Epidemiol. 2009 Dec;62(12):1226–32.         [ Links ]

13. Vélez M, Egurrola J, Jaimes Barragán F. Ronda clínica y epidemiológica Uso de la puntuación de propensión (propensity score) en estudios no experimentales. Iatreia. 2013;26(1):95–101.         [ Links ]

14. Zigler CM, Belin TR. The potential for bias in principal causal effect estimation when treatment received depends on a key covariate. Ann Appl Stat. 2011 Jan;5(3):1876–92.         [ Links ]

15. Pfister R, Sharp S, Luben R, Welsh P, Barroso I, Salomaa V, et al. Mendelian randomization study of B-type natriuretic peptide and type 2 diabetes: evidence of causal association from population studies. PLoS Med. 2011 Oct;8(10):e1001112.         [ Links ]

16. Palmer TM, Thompson JR, Tobin MD, Sheehan NA, Burton PR. Adjusting for bias and unmeasured confounding in Mendelian randomization studies with binary responses. Int J Epidemiol. 2008 Oct;37(5):1161–8.         [ Links ]

17. Sheehan NA, Didelez V, Burton PR, Tobin MD. Mendelian randomisation and causal inference in observational epidemiology. PLoS Med. 2008 Aug 26;5(8):e177.         [ Links ]

18. Keavney B, Danesh J, Parish S, Palmer A, Clark S, Youngman L, et al. Fibrinogen and coronary heart disease: test of causality by ''Mendelian randomization''. Int J Epidemiol. 2006 Aug;35(4):935–43.         [ Links ]

19. Casas JP, Bautista LE, Smeeth L, Sharma P, Hingorani AD. Homocysteine and stroke: evidence on a causal link from mendelian randomisation. Lancet. 2005;365(9455):224–32.         [ Links ]

20. Wehby GL, Ullrich F, Xie Y. Very low birth weight hospital volume and mortality: an instrumental variables approach. Med Care. 2012 Aug;50(8):714–21.         [ Links ]

21. Allareddy V, Ward MM, Wehby GL, Konety BR. The connection between selective referrals for radical cystectomy and radical prostatectomy and volumeoutcome effects: an instrumental variables analysis. Am J Med Qual. 2012;27(5):434–40.         [ Links ]

22. Cain LE, Cole SR, Greenland S, Brown TT, Chmiel JS, Kingsley L, et al. Effect of highly active antiretroviral therapy on incident AIDS using calendar period as an instrumental variable. Am J Epidemiol. 2009 May 1;169(9):1124–32.         [ Links ]