SciELO - Scientific Electronic Library Online

 
vol.39 número1Attributed costs of health care-associated infections in a Colombian hospital, 2011- 2015Bioethics and public policies in neonatal screening in the United States, United Kingdom, and Colombia índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Em processo de indexaçãoCitado por Google
  • Não possue artigos similaresSimilares em SciELO
  • Em processo de indexaçãoSimilares em Google

Compartilhar


Biomédica

versão impressa ISSN 0120-4157

Biomédica vol.39 no.1 Bogotá jan./mar. 2019

https://doi.org/10.7705/biomedica.v39i1.4103 

Artículos originales

Propiedades psicométricas de la escala EMUN-AR determinadas mediante el análisis de Rasch

Psychometric variables of the EMUN-AR scale using Rasch analysis

Mauricio Rivera1 

Óscar Cano1 

Jorge Rodríguez-Losada2 

Ricardo Sánchez2  * 

1 Facultad de Medicina, posgrado de Psiquiatría, Universidad Nacional de Colombia, Bogotá, D.C., Colombia

2 Departamento de Psiquiatría, Facultad de Medicina, Universidad Nacional de Colombia, Bogotá, D.C., Colombia


Resumen

Introducción.

Las escalas de autorreporte se han considerado útiles para evaluar y vigilar los síntomas de la enfermedad maníaco-depresiva. Uno de estos instrumentos, la escala de medición de la enfermedad maníaco-depresiva mediante autorreporte (EMUN-AR), no se ha validado aún.

Objetivo.

Validar la escala EMUN-AR usando el modelo de Rasch.

Materiales y métodos.

La escala EMUN-AR mide 26 ítems que evalúan por dimensiones los síntomas de la enfermedad maníaco-depresiva en tres categorías: frecuencia, intensidad y grado de molestia causada. Para evaluar las propiedades psicométricas de la escala, se efectuaron análisis factoriales exploratorios con el fin de tener una aproximación de su estructura latente, y se usaron modelos de Rasch que incluyeron la 'unidimensionalidad', la confiabilidad, el ajuste de ítems, el ordenamiento de umbrales, y los mapas de personas e ítems.

Resultados.

Se seleccionó una muestra de 267 pacientes hospitalizados, 204 de los cuales había sufrido un episodio maníaco (76,4 %) y estaba recibiendo tratamiento farmacológico. Se encontró una estructura factorial que puede resumirse en cuatro dominios: activación, inhibición, ideas depresivas e inadaptación. El análisis de Rasch evidenció la unidimensionalidad en los factores, adecuados valores de confiabilidad, buen ajuste de los 26 ítems en general (excepto en el ítem que mide las ideas de muerte o suicidio), un funcionamiento deficiente del sistema de calificación de los ítems y un cubrimiento limitado de los síntomas de la enfermedad correspondientes a las formas atenuadas.

Conclusión.

Se modificó la escala original en dos aspectos: se ajustó un ítem cuyos indicadores marginales tenían mal ajuste y se redujo el número de categorías. En su forma actual, el instrumento es apropiado para medir las formas graves de la enfermedad maníaco-depresiva, mas no así las atenuadas.

Palabras clave: psiquiatría;servicio de psiquiatría en hospital; trastorno bipolar; estudios de validación; autoevaluación; autoevaluación diagnóstica; escalas de valoración psiquiátrica

Abstract

Introduction:

Self-report scales have been considered to be useful for evaluating and monitoring symptoms of manic-depressive illnesses. The EMUN-AR scale is one of such scales but it has not been validated.

Objective:

To validate the EMUN-AR scale using Rasch models.

Materials and methods:

The EMUN-AR scale measures 26 items to assess comprehensively symptoms of manic-depressive illnesses in three domains: Frequency, severity, and level of disturbance caused by the symptoms. To test the psychometric properties of this scale, we used the exploratory factorial and Rasch analyses. The Rasch analysis included unidimensionality, reliability, item fit, threshold ordering, and person-item maps.

Results:

The study included 267 hospitalized patients, most of them with a manic episode diagnosis (n=204, 76.4%), and receiving pharmacological treatment. The factor structure was summarized in four domains: Activation, inhibition, depressive ideation, and maladaptive behavior. The Rasch analysis supported unidimensionality of the EMUN-AR factors, satisfactory levels of reliability, and appropriate item fit, except for one of the items measuring death or suicidal thoughts. However, the scale did not measure adequately the mild forms of the illness given its redundant and unordered thresholds.

Conclusion:

The EMUN-AR was modified in two aspects: An item whose marginal indicators were poorly adjusted and the reduction in the number of categories. In its current form, the EMUN-AR is appropriate for measuring severe forms of the illnesses, but it does not adequately measure the mild forms of manic-depressive illnesses.

Key words: Psychiatry; psychiatric department, hospital; bipolar disorder; validation studies; self-assessment; diagnostic self-evaluation; psychiatric status rating scales.

El trastorno bipolar es una condición relativamente frecuente. Su prevalencia en diversas situaciones de la atención primaria de muchos países (por ejemplo, Estados Unidos, Hungría, Finlandia, España, Bélgica, Canadá, Francia y Brasil) alcanza valores entre 7,6 y 9,8 % 1,2, y la prevalencia a lo largo de la vida se encuentra entre el 1 y el 2 % en la población mayor de 20 años 3.

Es un trastorno mental crónico y grave que se caracteriza por la aparición irregular y frecuentemente alternada de episodios de activación (manía- hipomanía) o inhibición (depresión) entremezclados con períodos de eutimia. La gravedad de dichos episodios varía mucho y pueden verse desde cuadros clínicos con sintomatología leve hasta episodios muy graves que requieren hospitalizaciones prolongadas. Esta variabilidad en la gravedad de los síntomas ha llevado a plantear la existencia de un espectro bipolar 3, cuya frecuencia en la población general es de hasta 6,5 % 4,5. El trastorno bipolar es potencialmente letal (el riesgo de suicidio es veinte veces mayor que en la población general) 6, y tiene unas repercusiones sociales y económicas importantes que pueden atenuarse si se hacen un diagnóstico y un tratamiento adecuados.

Se ha encontrado que, a menudo, en la evaluación del médico tratante los síntomas hipomaníacos de la enfermedad bipolar pasan desapercibidos y se tiende a subvalorar los síntomas depresivos 7,8. Estos hallazgos han justificado el desarrollo de instrumentos de autorreporte para diagnosticar categorías relacionadas con el espectro bipolar, entre los cuales se encuentran: el cuestionario de depresión bipolar II 9, el cuestionario de autorreporte de síntomas afectivos (MOODS-SR) 10,11, la lista de chequeo delahipomanía12,las escalas análogo-visuales múltiples parabipolaridad, la escala de maníaauto calificada de Altman14,el inventario rápido de sintomatología depresiva 15, el inventario de manía por autorreporte 16 y la escala del estado interno17.

Las medidas de los resultados reportados por los pacientes (Patient Reported Outcome Measures, PROM) vienen ganando importancia en la atención en salud 18,19. Aunque habitualmente las PROM se han relacionado con medidas de la calidad de vida, también se incluyen en esta categoría reportes del estado de salud, el autorreporte de disfuncionalidad, el de satisfacción del paciente y la autoevaluación de síntomas, entre otros 18,20.

Aunque la utilidad de los instrumentos de autoevaluación en pacientes con trastornos del estado de ánimo se ha cuestionado en diferentes estudios 21, algunos autores han encontrado un funcionamiento similar de las escalas de evaluación empleadas por el médico tratante y la autoevaluación de la depresión 22. Hay estudios que sugieren que, independientemente de la gravedad de su cuadro clínico, los pacientes con sintomatología maníaca pueden calificar sus síntomas de manera válida y confiable 23, y que tales instrumentos resultan de utilidad en la práctica 24. Además, se ha encontrado que con este tipo de instrumentos se detectan manera adecuada los efectos del tratamiento, por lo cual pueden ser de gran utilidad para vigilar el resultado de las intervenciones terapéuticas 25. Otras ventajas de los instrumentos de autoevaluación incluyen la posibilidad de efectuar una medición más frecuente de los síntomas, la utilidad que pueden tener en las intervenciones de psicoeducación y la capacidad de detectar con mayor facilidad cambios rápidos en el cuadro clínico, como sucede en variedades de ciclos rápidos de la enfermedad bipolar 26.

Hasta donde tenemos conocimiento, no existen instrumentos de autoevaluación de los síntomas de la enfermedad bipolar que se hayan desarrollado y validado en poblaciones hispanoamericanas; el único instrumento que encontramos disponible fue la escala de autorreporte para medición de síntomas maniacos en enfermedad maniaco depresiva (EMUN-AR) 27, basada en la escala para manía de la Universidad Nacional de Colombia (EMUN) 28, cuyas propiedades psicométricas no se han determinado aún. Además, el instrumento no fue diseñado para hacer el diagnóstico sino para evaluar la evolución del trastorno 27.

El objetivo del presente estudio fue validar la escala EMUN-AR para determinar sus propiedades psicométricas. Según la información disponible, este es el primer instrumento desarrollado en una población hispanoparlante, que utiliza la medición de los resultados reportados por los propios pacientes.

Materiales y métodos

La escala se validó utilizando la metodología de análisis de Rasch para ítems politómicos mediante modelos de escala de clasificación. Los pacientes se evaluaron entre el 2012 y el 2016, en diferentes servicios de hospitalización de instituciones de atención psiquiátrica en Bogotá (Clínica Fray Bartolomé de las Casas, Clínica Santa Clara, Hospital La Victoria, Clínica Nuestra Señora de la Paz, Hospital Simón Bolívar), en Chía (Hospital San Juan de Dios) y en Manizales (Hospital San Juan de Dios).

Se consideraron como elegibles los pacientes con diagnóstico consignado en la historia clínica de trastorno bipolar en episodio maníaco, hipomaníaco mixto, que supieran leer y escribir, y que expresaran su aceptación de participar en el estudio luego de tramitar un consentimiento informado.

Los pacientes elegibles fueron evaluados por dos investigadores, psiquiatras con experiencia clínica en el diagnóstico y el tratamiento de la enfermedad bipolar, quienes de manera independiente hicieron una entrevista semiestructurada basada en criterios del DSM-IV, durante el curso de los primeros ocho días a partir del ingreso del paciente.

Después de la evaluación, un investigador independiente, también médico psiquiatra, contrastaba el diagnóstico efectuado por cada psiquiatra; en caso de que no hubiera concordancia, se trataba de llegar a un consenso informal con la participación de los dos psiquiatras y el investigador independiente. En la muestra del estudio, se incluyeron solo los pacientes sobre cuyo diagnóstico hubo acuerdo o consenso entre los investigadores.

La escala evaluada consta de 26 ítems, cada uno con tres dimensiones calificadas de manera ordinal, mediante los cuales se evalúan los síntomas del trastorno bipolar aparecidos durante la semana anterior a su utilización.

Esta escala se desarrolló para medir los síntomas de la enfermedad maníaco-depresiva a partir del reporte del propio paciente y desde una perspectiva dimensional, asumiendo que los síntomas depresivos pueden ser parte constitutiva del síndrome maníaco, por lo que en nueve de los 26 ítems se evalúa la sintomatología depresiva 27. La escala permite evaluar el síndrome maníaco en tres dimensiones: frecuencia, intensidad y grado de inadaptación generado por los síntomas.

Los 26 ítems, distribuidos en estas tres dimensiones, se miden en una escala de tipo Likert con diez categorías, que van de “nada” a “muchísimo” para la intensidad y, de “nunca” a “todo el tiempo”, para la frecuencia. Para el grado de inadaptación, la escala tiene cuatro categorías, también en escala ordinal, que van de “ninguna molestia” a “mucha molestia”.

El puntaje total de la escala resulta de la suma de los puntos de cada uno de los ítems, de manera que los puntajes más altos reflejan los cuadros clínicos de mayor gravedad. Además, se diseñó un instrumento en el que se registraron variables como el sexo, la edad, los medicamentos que estaba recibiendo el paciente en el momento de la evaluación y el tiempo de evolución de la enfermedad.

Análisis estadístico

Se hicieron análisis descriptivos de las variables demográficas, clínicas y de los puntajes de la escala en cada una de sus tres dimensiones. Para resumir las variables continuas, se usaron medias o medianas con sus correspondientes medidas de dispersión: desviación estándar (DE) o rango intercuartílico (RIC). En el caso de las variables categóricas, se reportaron frecuencias y porcentajes.

El tamaño de la muestra se ajustó a la recomendación de un mínimo de 200 observaciones como número aceptable para los análisis factoriales 29 y un mínimo de 250 como número adecuado para el análisis con el modelo de Rasch 30.

Se efectuó un análisis factorial exploratorio para hacer una primera aproximación a la estructura de dominios del instrumento en cada una de sus dimensiones. Este análisis preliminar se basó en la recomendación de disponer tempranamente de posibles dimensiones latentes antes del análisis de Rasch31.

Considerando que cada ítem estaba calificado en una escala ordinal, se calcularon matrices de correlación policórica, a partir de las cuales se hicieron pruebas de viabilidad de factorización (la de esfericidad de Bartlett y la de Kaiser-Neyer-Olkin o KMO) 32. Para determinar el número de factores, se utilizaron un análisis paralelo 33 y un método de extracción de factores de mínimos cuadrados ponderados y, posteriormente, una rotación ortogonal y una oblicua, para determinar la estructura factorial que permitiera la mejor interpretación. Para estos procedimientos, se utilizó el programa R. Teniendo en cuenta que todos los ítems del instrumento en cada uno de sus tres componentes (intensidad, frecuencia y grado de molestia) se miden en una misma escala ordinal, para el análisis de Rasch se usaron los siguientes procedimientos en un modelo de escala de calificación:

  1. Evaluación de la unidimensionalidad mediante la evaluación de los valores de cuadrado medio de ajuste con información ponderada (infit): el rango aceptable está entre 0,6 y 1,5 y los valores correspondientes a la desviación estándar de los coeficientes estandarizados menores de dos. Otra forma de asumir la unidimensionalidad es cuando, en el análisis de componentes principales de residuos, la varianza explicada por la medición es mayor del 40 % y el valor propio de la varianza no explicada en el primer contraste es menor a dos valores propios34.

  2. Determinación de los índices de confiabilidad de personas e ítems: se calcularon los coeficientes de confiabilidad usando el análisis de componentes principales de residuos. Como medida adicional de confiabilidad, se estimaron las medidas de separación (número de niveles en los cuales pueden agruparse tanto los ítems como los individuos). Se consideran adecuadas las medidas de separación superiores a dos para las personas y a tres para los ítems 35.

  3. Examen de la calidad del ajuste de cada uno de los ítems al modelo mediante la estimación del cuadrado medio (median square, MSQ) de los parámetros estadísticos de ajuste infit, es decir, el ajuste sensible a los casos atípicos (outliers) y el ajuste sensible a los patrones internos(outfit).

  4. Evaluación de la calidad de las categorías de respuesta de los ítems, para lo cual se evaluó qué tan adecuado era el orden de las categorías en la detección de una mayor intensidad del atributo (mayor gravedad del episodio de la enfermedad maniaco depresiva). Además, se evaluaron las curvas de probabilidades de las categorías.

  5. Evaluación de los mapas de personas e ítems. Estos análisis se hicieron con el programa Winsteps™.

Consideraciones éticas

El estudio fue aprobado por el Comité de Ética de la Facultad de Medicina de la Universidad Nacional de Colombia.

Resultados

En el estudio participaron 267 pacientes, de los cuales 114 eran mujeres (42,7 %). La media de edad fue de 40,3 años (DE=12,7 años). La mediana de evolución de la enfermedad fue de 12 años (RIC=16 años).

El tipo de episodio más frecuentemente encontrado fue el maniaco (76,4%;n=204), seguido del depresivo, el mixto yel no especificado (6,7% paracada una de estas tres categorías;n=17) y, por último, del hipomaníaco (4,5%;n=12).

En total, 251 (94 %) pacientes recibían tratamiento con moduladores del ánimo, 208 (78 %), con antipsicóticos, 163 (61 %), con benzodiacepinas y, 16 (6 %), con antidepresivos.

La mediana del puntaje en la dimensión de frecuencia fue de 67 (RIC=71) y, en la de intensidad, de 71 (RIC=78) (en estas dos dimensiones los posibles rangos de los puntajes estuvieron entre 0 y 260).En la dimensión de la molestia, la mediana fue de 18 (RIC=29), dimensión en la que los puntajes estuvieron entre 0 y78.

En los componentes de intensidad y frecuencia, los ítems que tuvieron la mayor mediana de puntaje fueron la hiperbulia y la euforia, en tanto que aquellos con las menores medianas fueron los relacionados con los episodios depresivos (cuadro 1). En el grado de molestia, las medianas de la puntuación estuvieron por debajo de 2 en todos los ítems.

Cuadro 1 Estructura factorial de cada una de las dimensiones de la escala EMUN-AR 

En los componentes de frecuencia, intensidad y nivel de molestia, respectivamente, las medianas (RIC) según los diagnósticos fueron las siguientes: episodio maníaco: 64,5 (71,5), 69,5 (78) y 13,5 (25,5); episodio depresivo: 63 (61), 81 (78) y 35 (18); episodio mixto: 100 (39), 105(76) y 39 (22); episodio no especificado: 81 (42), 74 (46) y 24 (15);episodio hipomaníaco: 23 (77), 37,5 (87) y 13,5 (36,5).

Análisis factorial

En los análisis de viabilidad de la factorización de las matrices de correlación, se encontraron los siguientes resultados: para la dimensión de intensidad, el KMO fue de 0,91; para la dimensión de frecuencia, de 0,91, y para la de molestia, de 0,93. En las tres dimensiones, el test de esfericidad de Bartlett arrojó un valor de p menor de 0,0001. Según el criterio de análisis paralelo, se sugirieron cuatro factores en las dimensiones de frecuencia y molestia, y cinco en la dimensión de intensidad. Estos factores explicaron el 63 % de la varianza en la dimensión de intensidad, el 60 % en la dimensión de frecuencia y el 51 % en la de molestia.

Los resultados del análisis factorial se presentan en el cuadro 1. La estructura de dominios fue similar en cada una de las tres dimensiones de la escala, especialmente en las dimensiones de intensidad y frecuencia; esta estructura factorial puede resumirse de la siguiente manera.

Factor 1 (F1): representa un síndrome de activación y está compuesto por los síntomas típicos del episodiomaníaco.

Factor 2 (F2): corresponde a un síndrome de inhibición en el cual se agrupan los síntomas típicos de un episodiodepresivo.

Factor 3 (F3): agrupa síntomas relacionados con las consecuencias sociales del estado de activación oinhibición.

Factor4(F4):correspondeaundominiorelacionadoconideasdepresivas.

Factor 5 (F5): representa un síndrome de descontrol caracterizado por irritabilidad, hostilidad yagresividad.

Los factores 3 y 5 tienden a agruparse en uno solo, cuando los síntomas se miden según su frecuencia o el grado de molestia que generan. Esta agrupación corresponde a un dominio relacionado con los síntomas de inadaptación.

Análisis de Rasch

Unidimensionalidad. En los cuatro dominios encontrados en el análisis factorial exploratorio, la varianza explicada por la medición superó en todos los casos el 40 %, y el valor propio de la varianza no explicada en el primer contraste fue menor de dos valores propios (cuadro 2).

Cuadro 2 Valores de la varianza de los residuos dentro de cada factor y para cada componente de la escala* 

Para el componente de frecuencia, los valores de cuadrado medio del infit se ubicaron entre 0,74 para el ítem 6 (fuga de ideas) y 1,54 para el ítem 12 (ideación de muerte o suicidio). Para el componente de intensidad, estos valores se encontraron entre 0,71 para el ítem 6 (fuga de ideas)y 1,56 para el ítem 12 (ideación de muerte o suicidio). Para el componente del grado de molestia, dichos valores se encontraron entre 0,81 para el ítem 15 (hiperactividad) y 1,15 para el 19 (disminución de la necesidad de dormir). Los valores globales de los cuadrados medios del infit y el outfit estuvieron dentro de los rangos considerados adecuados (cuadro 3).

Cuadro 3 Medidas de ajuste y confiabilidad de los modelos correspondientes a cada componente de la escala 

MNSQ: cuadrados medios; ZSTD: estandarízación Z

Determinación de los índices de confiabilidad de personas e ítems. Todos los valores de confiabilidad, tanto para las personas como para los ítems, tuvieron valores superiores a 0,8. Los índices de separación fueron superiores a 2 para las personas y, a 3, para los ítems (cuadro 3).

Examen de la calidad del ajuste de cada uno de los ítems al modelo. Para el ítem 12 (ideación de muerte o suicidio), los cuadrados medios (MNSQ) del infit arrojaron valores ligeramente superiores a 1,5 en los componentes de intensidad y frecuencia y valores superiores a tres en los resultados estandarizados como un puntaje z (standardized as a z-score, ZSTD) de los tres componentes (cuadro 4). Esto sugiere que este ítem puede presentar problemas de ajuste dentro de la escala. Para los demás ítems no se encontraron valores anómalos de MNSQ, lo cual indica un adecuado ajuste en el modelo de medición.

Cuadro 4 Medidas de ajuste de los ítems para cada uno de los tres componentes de la escala 

MNSQ: cuadrados medios; ZSTD: estandarízación Z

Evaluación de la calidad de las categorías de respuesta de los ítems

Las medidas de las categorías de cada componente de la escala, mostraron los siguientes resultados:

Frecuencia: las medidas para cada uno de los diez niveles consecutivos en los que se evalúan los ítems, fueron 0,97; -1,04; 0,46; 0,21; -1,04; 1,63; -0,81; -0,35; 1,46, y -1,49.

Intensidad: las medidas correspondientes a cada uno de los diez niveles fueron 1,04; -0,83; 0,49; 0,23; -1,38; 1,29; -0,78; 0,19; 0,86, y -1,10.

Nivel de molestia: las medidas en cada uno de los cuatro niveles en los que se evalúan los ítems (de 0 a 3), fueron -0,12; -0,17, y 0,9.

Como puede verse, no hubo un ordenamiento en las medidas según el nivel. Las curvas de probabilidad evidenciaron que solo tres categorías captaron la variabilidad de la medida de cada componente (figura 1).

El componente de grado de molestia tiene 4 categorías. 

Evaluación de los mapas de personas e ítems

En las dimensiones de intensidad y frecuencia la media de las personas fue cercana a la desviación estándar media por debajo de la media de dificultad de los ítems; en el grado de molestia esta diferencia fue de una desviación estándar. En las tres dimensiones, aproximadamente la mitad de los pacientes con síntomas maníaco-depresivos de menor intensidad no quedó adecuadamente cubierta por los ítems de la escala, lo cual indica que el instrumento mide cuadros graves de la enfermedad.

En los componentes de intensidad y frecuencia los ítems 8 (intensidad de voz baja) y 12 (ideación de muerte o suicidio) fueron los mejores indicadores de la gravedad del cuadro. En el componente del nivel de molestia el mejor indicador fue el aumento de sociabilidad.

En cuanto la frecuencia e intensidad de los síntomas de manía clásica (urgencia del pensamiento, megalomanía, hiperbulia, aumento de energía y afecto eufórico), estos son síntomas fácilmente reportados que no permiten definir la gravedad del episodio (se presentan, incluso, en cuadros no tan graves). En el grado de molestia, los síntomas depresivos (irritabilidad, aburrimiento y labilidad) fueron los reportados con más facilidad, por lo que no resultan buenos indicadores de la gravedad del episodio (figura 2).

Figura 2 Mapas de personas e ítems para cada dimensión de la escala EMUN-AR En el lado izquierdo, se representa la distribución de los pacientes. En el lado derecho, se representa la distribución de los ítems de la escala. Para las personas, en la parte superior se ubican los pacientes con mayor intensidad, frecuencia o molestia causada por los síntomas. Para los ítems, en la parte superior se ubican los que recibieron mayor puntaje por parte de los pacientes con episodios de mayor gravedad. 

Discusión

El presente estudio se hizo en una muestra conformada principalmente por pacientes que habían presentado un episodio maníaco, pero con poca representación de otro tipo de episodios de la enfermedad maniacodepresiva (especialmente, pacientes con episodios hipomaníacos). Los valores encontrados en las medianas de los ítems reflejan esta característica de la muestra: los puntajes más bajos se encontraron en los ítems que miden características depresivas y de inhibición. Los valores bajos en las medianas de los ítems, especialmente en el componente de nivel de molestia, pudieron deberse a que los pacientes estaban recibiendo tratamiento.

En cada uno de los tres componentes del instrumento, se detectó una gradación de los síntomas (el episodio mixto fue el más grave, seguido del depresivo o del no especificado, luego del maníaco y, por último, del hipomaníaco). Esta gradación concuerda con la observación clínica (los episodios hipomaníacos son formas menos graves) y con los hallazgos reportados en otros estudios en los que las formas mixtas resultaron ser las más graves 36.Esto sugiere que la escala detectó adecuadamente diferentes niveles de gravedad de los episodios, independientemente de su tipo; el instrumento no fue diseñado para medir solamente episodios maniacos, sino también episodios de enfermedad maníaco-depresiva, trastorno en el que se considera que la mayoría de episodios tiene características mixtas.

Según los resultados del análisis factorial, el instrumento midió un síndrome constituido por cuatro dominios, en los que se destacaron un componente de activación, otro de inhibición y otro de descontrol y desajuste; la proporción de la varianza explicada por los factores en todos los casos, superó el mínimo recomendado 37.

Los resultados del análisis son similares a los reportados en estudios previos en Colombia al utilizar instrumentos de evaluación a cargo del médico tratante 28, en los que, además del componente de activación, se reconocen componentes depresivos y de agresividad (de forma similar a los de descontrol y desajuste detectados con los instrumentos de autoevaluación).

La diferencia que resulta llamativa entre la estructura factorial medida mediante la autoevaluación y la medida mediante el reporte del clínico, es que en la primera se diferencia el síndrome de activación en dos componentes (motor y cognoscitivo), mientras que, en la segunda, es el componente de inhibición el que se descompone (inhibición e ideas depresivas). Esto podría indicar que la medición por parte del médico tratante hace poco énfasis en la sintomatología depresiva cuando se miden los síntomas de la enfermedad maníaco-depresiva. En este sentido, podría decirse que la EMUN-AR tiene una mayor capacidad para detectar la sintomatología mixta que la versión disponible de la escala utilizada por el médico tratante.

En cuanto al análisis de Rasch, se encontró que el instrumento tiene una adecuada dimensionalidad de los factores subyacentes, lo cual es de destacar ya que, si hay violaciones al supuesto de unidimensionalidad, las estimaciones de los parámetros de la escala y de los ítems pueden resultar sesgados por una mala especificación del modelo 38.

Los indicadores de confiabilidad del modelo de Rasch resultaron adecuados (se consideran como buenos los valores mayores de 0,8 excelentes, los mayores de 0,9) 39. Además, los índices de separación de ítems fueron adecuados, lo cual indica una correcta jerarquía de ítems y de personas. Se encontró que solamente uno de los ítems (ideación de muerte o suicidio) presentó indicadores marginales de mal funcionamiento, lo que se explicaría por varias razones:

  1. este ítem constituyó un indicador de la gravedad del episodio y la muestra tuvo niveles más bajos del atributo de los que la escala permite detectar;

  2. el ítem tuvo un mal ajuste y debe retirarse del instrumento;

  3. los indicadores marginales de mal ajuste sugieren que este debía evaluarse nuevamente, aplicándolo en una muestra con una variabilidad mayor o incluyendo en la escala ítems adicionales que expandan el espectro depresivo u otros síntomas adicionales,y

  4. el ítem podría dividirse en dos componentes independientes (muerte o suicidio), pues la causa de los parámetros estadísticos de ajuste podría ser una mala formulación del ítem.

Se consideró que esta última razón debía ser evaluada prioritariamente, por la cual se propuso ajustar el instrumento original e introducir esta modificación.

El desempeño de la escala de medición de los ítems evidenció que solamente tres de los diez niveles de medición utilizados resultaron adecuado: los pacientes no fueron capaces de discernir entre tantos puntos de medición (pudieron discriminar adecuadamente tres niveles en cada uno de los tres componentes de la escala).

El hallazgo de niveles de medición redundantes en los ítems se acompañó de una falta de orden en la detección de diferentes volúmenes de intensidad del atributo, lo que exige reajustar este sistema de medición: con solo tres niveles se podría evaluar adecuadamente cada síntoma en cualquiera de los tres componentes. Este hallazgo podría explicarse por la poca exposición de los pacientes a sistemas de medición de esta complejidad (son los médicos tratantes los que más están habituados a utilizar tales sistemas).

En cuanto a los mapas de personas e ítems, se destaca lo siguiente:

  1. la escala EMUN-AR resultó ser más eficaz para medir cuadros graves de la enfermedad bipolar;

  2. los cuadros leves no pudieron medirse adecuadamente;

  3. si el paciente detectaba la baja intensidad de la voz y reportaba ideaciones de muerte o suicidio entre sus síntomas, el cuadro tenía más probabilidad de ser grave, y

  4. si el aumento de sociabilidad era percibido por el paciente como molesto, había mayor probabilidad de que presentara un cuadro grave.

Teniendo en cuenta estos resultados, el diseño de un instrumento que permita medir todo el espectro de episodios de la enfermedad maníaco- depresiva, debe incluir ítems que cubran el espectro de menor gravedad. Dada la deficiente cobertura de síntomas correspondientes a episodios menos graves, la utilidad del instrumento en su versión actual puede ser mayor en servicios de hospitalización; sin embargo, ello no descarta que se pueda utilizar como un instrumento de autoevaluación que permita al paciente detectar la reactivación de episodios graves de la enfermedad.

El estudio tuvo las siguientes dos limitaciones. La primera es que la muestra representaba solo de manera parcial a los pacientes con cuadros graves de trastorno bipolar bajo tratamiento farmacológico en el hospital. Es posible que el tratamiento recibido distorsione la calidad de la medición de la autoevaluación. El hecho de que se tratara de pacientes hospitalizados implica que los síntomas iniciales (que no son tanto de inadaptación) no se registraron, lo que es una debilidad del instrumento. La segunda limitación es que no se registró el tiempo de hospitalización y no se puede descartar que, al ser tan prolongados los periodos de evolución de los síntomas, su percepción se atenúe.

La disponibilidad de este instrumento de autoevaluación supone continuar la investigación para agregarle nuevos ítems y, así, incorporar la medición de formas atenuadas de la enfermedad. Los estudios adicionales que midan la concordancia entre la evaluación médica y la autoevaluación del paciente, pueden dar información importante sobre puntos que no se hayan tenido en cuenta en la valoración clínica del paciente, lo cual sería útil en estudios de diagnóstico y seguimiento.

La escala EMUN-AR tiene una estructura factorial que incorpora diferentes componentes de la enfermedad maníaco-depresiva y no solo síntomas maníacos. El instrumento demostró tener valores adecuados de confiabilidad y, con excepción de un caso, un ajuste apropiado de los ítems. La escala de medición de los ítems evidenció problemas de redundancia y de falta de capacidad para detectar ordenadamente diferentes grados de intensidad del síntoma. Por esta razón, se modificó su estructura y se dejaron solo tres niveles (Anexo 1). La medición adecuada de todo el espectro de la enfermedad requerirá la incorporación de ítems adicionales que midan los síntomas de formas atenuadas.

Referencias

1. Cerimele JM, Chwastiak LA, Dodson S, Katon WJ. The prevalence of bipolar disorder in general primary care samples: A systematic review. Gen Hosp Psychiatry. 2014;36:19-25. https://doi.org/10.1016/j.genhosppsych.2013.09.008Links ]

2. Rouillon F, Gasquet I, Garay RP, Lancrenon S. Screening for bipolar disorder in patients consulting general practitioners in France. J Affect Disord. 2011;130:492-5. https://doi.org/10.1016/j.jad.2010.10.037Links ]

3. Goodwin FK, Jamison KR, Ghaemi SN. Manic-depressive illness: Bipolar disorders and recurrent depression. Second edition. New York, N.Y.: Oxford University Press; 2007. p. 1262. [ Links ]

4. Bauer M, Pfennig A. Epidemiology of bipolar disorders. Epilepsia. 2005;46(Suppl.4):8-13. [ Links ]

5. Merikangas KR, Akiskal HS, Angst J, Greenberg PE, Hirschfeld RM, Petukhova M, et al. Life time and 12-month prevalence of bipolar spectrum disorder in the National Comorbidity Survey replication. Arch Gen Psychiatry. 2007;64:543-52. https://doi.org/10.1001/archpsyc.64.5.543Links ]

6. Hirschfeld RM, Williams JB, Spitzer RL, Calabrese JR, Flynn L, Keck PE Jr, et al. Development and validation of a screening instrument for bipolar spectrum disorder: The Mood Disorder Questionnaire. Am J Psychiatry. 2000;157:1873-5. https://doi.org/10.1176/appi.ajp.157.11.1873Links ]

7. Perlis RH. Misdiagnosis of bipolar disorder. Am J Manag Care. 2005;11(Suppl.9):S271-4. [ Links ]

8. Correa R, Akiskal H, Gilmer W, Nierenberg AA, Trivedi M, Zisook S. Is unrecognized bipolar disorder a frequent contributor to apparent treatment resistant depression? J Affect Disord . 2010;127:10-8. https://doi.org/10.1016/j.jad.2010.06.036Links ]

9. Leung CM, Yim CL, Yan CT, Chan CC, Xiang YT, Mak AD, et al. The Bipolar II Depression Questionnaire: A self-report tool for detecting bipolar II depression. PLoS One. 2016;11:e0149752. https://doi.org/10.1371/journal.pone.0149752Links ]

10. Rucci P, Maser JD. Instrument development in the Italy-USA Collaborative Spectrum Project. Epidemiol Psichiatr Soc.2000;9:249-56. [ Links ]

11. Ioannou M, Dellepiane M, Benvenuti A, Feloukatzis K, Skondra N, Dell’Osso L, et al. Swedish version of Mood Spectrum Self-Report Questionnaire: Psychometric properties of lifetime and last-week version. Clin Pract Epidemiol Ment Health. 2016;12:14-23. https://doi.org/10.2174/1745017901612010014Links ]

12. Meyer TD, Schrader J, Ridley M, Lex C. The Hypomania Checklist (HCL) - systematic review of its propertiesto screen for bipolar disorders.Compr Psychiatry.2014;55:1310-21. https://doi.org/10.1016/j.comppsych.2014.03.002Links ]

13. Ahearn EP, Cassidy F, Kelley L, Weisler RH, Carroll BJ. Dimensions of self-rated mood in depressed, manic, and normal subjects.Compr Psychiatry. 2001;42:196-201. https://doi.org/10.1053/comp.2001.23125Links ]

14. Altman EG, Hedeker D, Peterson JL, Davis JM. The Altman Self-Rating Mania Scale. Biol Psychiatry. 1997;42:948-55. https://doi.org/10.1016/S0006-3223(96)00548-3Links ]

15. Rush AJ,Gullion CM, Basco MR, Jarrett RB,Trivedi MH.The Inventory of Depressive Symptomatology (IDS): Psychometric properties. Psychol Med.1996;26:477-86. [ Links ]

16. Shugar G, Schertzer S, Toner BB, Di Gasbarro I. Development, use, and factor analysis of a self-report inventory for mania. Compr Psychiatry . 1992;33:325-31. https://doi.org/10.1016/0010-440X(92)90040-WLinks ]

17. Bauer MS, Crits-Christoph P, Ball WA, Dewees E, McAllister T, Alahi P, et al. Independent assessment of manic and depressive symptoms by self-rating. Scale characteristics and implications for the study of mania. Arch Gen Psychiatry.1991;48:807- 12. https://doi.org/10.1001/archpsyc.1991.01810330031005Links ]

18. Rose M, Bezjak A. Logistics of collecting patient-reported outcomes (PROs) in clinical practice: An overview and practical examples. Qual Life Res.2009;18:125-36. https://doi.org/10.1007/s11136-008-9436-0Links ]

19. Lohr KN, Zebrack BJ. Using patient-reported outcomes in clinical practice: Challenges and opportunities.Qual Life Res.2009;18:99-107. https://doi.org/10.1007/s11136-008-9413-7Links ]

20. Greenhalgh J. The applications of PROs in clinical practice: What are they, do they work, andwhy? Qual Life Res .2009;18:115-23. https://doi.org/10.1007/s11136-008-9430-6Links ]

21. Jonsdottir H, Engh JA, Friis S, Birkenaes A, Ringen PA, Vaskinn A, et al. Measurement of insightin patients with bipolar disorder: Areself-rated scales developed for patients with schizophrenia applicable? J Nerv Ment Dis. 2008;196:333-5. https://doi.org/10.1097/NMD.0b013e31816a62b2Links ]

22. Bernstein IH, Rush AJ, Carmody TJ, Woo A,Trivedi MH. Clinical vs.self-report versions of the quick inventory of depressive symptomatology in a public sector sample. J Psychiatr Res. 2007;41:239-46. https://doi.org/10.1016/j.jpsychires.2006.04.001Links ]

23. AltmanE. Rating scales for mania: Isself-rating reliable? J Affect Disord .1998;50:283-6. https://doi.org/10.1016/S0165-0327(98)00018-4Links ]

24. Akiskal HS, Hantouche EG, Bourgeois ML, Azorin JM, Sechter D, Allilaire JF, et al.Toward a refined phenomenology of mania: Combining clinician-assessment and self-report in the French EPIMAN study. J Affect Disord . 2001;67:89-96. https://doi.org/10.1016/S0165-0327(01)00441-4Links ]

25. Altman E, Hedeker D, Peterson JL, Davis JM. A comparative evaluation of three self- rating scales for acute mania. Biol Psychiatry . 2001;50:468-71. https://doi.org/10.1016/ S0006-3223(01)01065-4Links ]

26. Picardi A.Rating scales in bipolar disorder.Curr Opin Psychiatry.2009;22:42-9. https://doi.org/10.1097/YCO.0b013e328315a4d2Links ]

27. Barrios K, Rodríguez-Losada J, Sánchez R. Desarrollo de una escala de auto-reporte para medición de síntomas maníacos. Revista de la Facultad de Medicina. 2013;61:245-53. [ Links ]

28. Sánchez R, Navarro Á, Rueda-Jaimes GE, Gómez-Restrepo C. Desarrollo y validación de la versión II de la escala EMUN. Revista Colombiana de Psiquiatría.2011;40:647-59. [ Links ]

29. Tabachnick BG, FidellLS.Using multivariate statistics. Fourth edition. Boston, MA: Allyn and Bacon; 2001. p.966. [ Links ]

30. DeMars C. Item response theory. Oxford; New York: Oxford University Press; 2010. p.131. [ Links ]

31. Smith R. A comparison of methods for determining dimensionality in Rasch measurement. Structural Equation Modeling. 1996;3:25-40. https://doi.org/10.1080/10705519609540027Links ]

32. Cerny BA, Kaiser HF. A study of a measure of sampling adequacy for factor-analytic correlation matrices. Multivariate Behav Res. 1977;12:43-7. https://doi.org/10.1207/s15327906mbr1201_3Links ]

33. Ruscio J, Roche B. Determining the number of factors to retain in an exploratory factor analysis using comparison data of known factorial structure. Psychol Assess.2012;24:282- 92. https://doi.org/10.1037/a0025697Links ]

34. Linacre JM. Rasch analysis of rank-ordered data. J Appl Meas. 2006;7:129-39. [ Links ]

35. Dimitrov DM,Smith RM. Adjusted Rasch person-fit statistics. J Appl Meas . 2006;7:170-83. [ Links ]

36. Pringuey D, Cherikh F, Giordana B, Fakra E, Dassa D, Cermolacce M, et al. Mixed states: Evolution of classifications. Encephale. 2013;39(Suppl.3):S134-8. https://doi.org/10.1016/S0013-7006(13)70111-8Links ]

37. Beavers A, Lounsbury J, Richards J, Huck S, Skolits G, Esquivel S. Practical considerations for using exploratory factor analysis in educational research. Practical Assessment, Research & Evaluation.2013;18:13. [ Links ]

38. Christensen KB, Kreiner S, Mesbah M. Rasch models in health. Hoboken, NJ: John Wiley & Sons; 2013. p.368. [ Links ]

39. Bond TG, Fox CM. Applying the Rasch model: Fundamental measurement in the human sciences. Third edition. New York; London: Routledge, Taylor and Francis Group; 2015. p.383. [ Links ]

Citación: Rivera M, Cano O, Rodríguez-Losada J, Sánchez R. Propiedades psicométricas de la escala EMUN- AR determinadas mediante el análisis de Rasch. Biomédica. 2019;39:113-31 https://doi.org/10.7705/biomedica.v39i1.4103

Contribución de los autores: Mauricio Rivera y Óscar Cano: recolección de los datos Jorge Rodríguez-Losada y Ricardo Sánchez: concepción del estudio, análisis e interpretación de los datos Todos los autores participaron en el diseño del estudio y en la redacción del manuscrito.

Financiación: El proyecto en cuyo marco se obtuvieron los resultados presentados, recibió financiación de la Universidad Nacional de Colombia.

Escala EMUN-AR para medición por autoreporte de síntomas maníacos.

Anexo 1 Esta es una escala para medir algunas características del trastorno bipolar o enfermedad maniacodepresiva. La escala mide 26 síntomas en tres aspectos: intensidad, frecuencia y grado de molestia que le generaron a usted estas manifestaciones de la enfermedad. Para llenar la escala tenga en cuenta lo que ha sentido en la última semana o lo que sintió durante la semana en que estuvo más grave (si no tiene síntomas recientemente, considere solo lo de la semana en que estuvo más grave, no importa cuándo haya sido). Hay una tabla por aparte para calificar cada uno de estos tres componentes (intensidad, frecuencia, grado de molestia). Para calificar cada síntoma marque con una equis sobre el círculo que mejor represente lo que usted sintió durante esa semana. 

Recibido: 28 de Septiembre de 2017; Aprobado: 09 de Agosto de 2018

*Correspondencia: Ricardo Sánchez, Carrera 65 No 22A-43, apartamento 502, torre 7, Bogotá, D.C., Colombia Teléfono: (313) 419 0729 rsanchezpe@unal.edu.co

Conflicto de intereses:

Los autores declaramos que no tenemos conflictos de intereses personales ni financieros, ni ningún acuerdo que pudiera representar un conflicto con el contenido del manuscrito.

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons