Introducción
La evaluación cognitiva o examen del estado mental de las personas, principalmente en ancianos, puede ser detectado a través de diferentes instrumentos de medición; entre los más utilizados se encuentra el Mini Mental (Mini Mental State Examination - MMSE) construido por Folstein y McHugh en 1975. El Examen del Estado Mental evalúa el comportamiento, orientación, actitud, percepción, juicio, abstracción y cognición del individuo (Bell & Hall, 1977).
El test es utilizado para detectar deterioro cognitivo y cuantificar su rendimiento global para demencias (Bermejo, Díaz, & Porta-Etessam, 2001), pero presenta limitaciones cuando se aplica a personas con demencia avanzada, tiene efecto suelo y techo, es sensible a la edad, cultura y educación, y no explora todos los dominios cognitivos (Llamas-Velasco, Llorente-Ayuso, Contador, & Bermejo-Pareja, 2015), y en las traducciones su comportamiento es diferente (Jones, 2006). Más recientemente se encontró que el MMSE-I (nueva versión) se puede usar en pacientes con demencia (Babacan-Yıldız et al., 2016) y en adultos mayores sanos, para determinar la disminución cognitiva (Kopecek, Bezdicek, Sulc, Lukavsky, & Stepankova, 2016).
Si bien el MMSE ha sido empleado en diferentes grupos de personas, en la literatura científica se han reportado limitaciones sobre su validez de generalización, aplicabilidad e interpretabilidad. Por ejemplo, Prieto, Delgado, Perea y Ladera (2011) identificaron Funcionamiento Diferencial de los Ítems (DIF) entre pacientes con enfermedad de Parkinson, Alzheimer y sin demencia para 11 de los 30 ítems que componen el instrumento. Esto ha llevado a resaltar otros test cognitivos breves (TCB) de menos costo y más fáciles de aplicar en comparación al MMSE (Carnero-Pardo, 2014). Estos argumentos han sido debatidos por Olazarán y Bermejo (2015).
En el caso particular de Colombia, la escala Mini Mental se ha utilizado como prueba diagnóstica para demencia, según los criterios del DSM-IV. Estudios locales han identificado variaciones según edad y nivel educativo que han llevado a sugerir ajustar las puntuaciones obtenidas en el instrumento en función de estas características para mejorar su desempeño (Rosselli et al., 2000; Pedraza et al., 2014).
A pesar de la amplia disponibilidad de investigaciones sobre las propiedades psicométricas del MMSE a nivel mundial, no se encuentra en la literatura un estudio de validación que retome de forma integral las diferentes facetas de validez reconocidas en la psicometría contemporánea (Wolfe & Smith, 2007; Messick, 1995); la mayoría de los estudios se han centrado en valorar su confiabilidad y consistencia interna (Olazarán & Bermejo, 2015). Estos indicadores de desempeño psicométrico no permiten concluir sobre la interpretabilidad de los resultados obtenidos mediante un test limitando su utilidad clínica, máxime dadas las limitaciones de validez de generalización como es el caso del MMSE. Contar con argumentos y evidencias de diferentes facetas de validez, le permite al clínico realizar interpretaciones del estado mental de sus pacientes con base en el conocimiento adquirido sobre su desempeño en el instrumento (Stelmack et al., 2004). De esta forma, en la presente investigación tiene como propósito evaluar las evidencias de validez del Mini Mental State Examination que sustentan la interpretabilidad de sus resultados en adultos mayores, siguiendo los lineamientos de Messick (1995) estructurados por Wolfe y Smith (2007).
Método
Diseño
Estudio de fuente secundaria basado en una investigación transversal sobre la situación de salud de los adultos mayores de Antioquia, Colombia, realizada en 2012 (Arango, Cardona, Duque, Cardona & Sierra; 2016). La metodología del estudio original ha sido reportada previamente (Cortés-Muñoz, Cardona-Arango, Segura-Cardona, & Garzón-Duque, 2016).
Participantes
Un total de 4034 participantes con 60 años de edad o más contestaron el MMSE. Los participantes fueron seleccionados mediante muestreo probabilístico por conglomerados bietápico representativo a nivel de subregiones del departamento de Antioquia. Se excluyeron los residentes de hogares geriátricos puesto que el instrumento fue aplicado en las viviendas a razón del diseño muestral.
Instrumento
Mini Mental State Examination (MMSE). Creado por Folstein et al. (1975), este instrumento se compone de 30 ítems dicotómicos que evalúan seis procesos cognitivos: Orientación Temporal, Orientación Espacial, Memoria de Fijación, Memoria de Evocación, Atención y Cálculo y Lenguaje.
Procedimiento
El instrumento fue aplicado por encuestadores en la residencia de cada participante. Los encuestadores recibieron un entrenamiento estandarizado en el protocolo del MMSE, en técnicas de muestreo y en calidad del dato. La información fue complementada con una encuesta de caracterización sociodemográfica y de condiciones de vida del adulto mayor.
Análisis de datos
Se realizaron los análisis recomendados por Wolfe y Smith (2007) para estudios de validación con el modelo de Rasch de la siguiente forma:
Ajuste y funcionamiento diferencial de los ítems (DIF)
El ajuste de los ítems a los supuestos del modelo de Rasch se valoró mediante medias cuadráticas de Outfit e Infit, correlaciones ítem-medida y análisis de independencia local. Para estos tres estadísticos se tomaron como valores esperados medias cuadráticas ente 0,50 y 2,00, correlaciones ítem-medida mayores a 0,30 y correlaciones entre los residuales de los ítems menores a 0,70 (Bond & Fox, 2001).
El DIF se valoró para establecer la estabilidad de las dificultades de los ítems entre sexos (hombre-mujer), estatus de enfermedad (enfermo-no enfermo) y edad (menores de 70 años - mayores). Se estimaron los contrastes de DIF y la probabilidad de la prueba de Mantel-Haenzel. Para controlar por falsos positivos debidos a comparaciones múltiples se consideraron como DIF significativos aquellos con valor crítico de Benjamini-Hoschberg menor a la probabilidad de la prueba de Mantel-Haenzel (Thissen, Steinberg, & Kuang, 2002) y con contraste de DIF mayor a 0,50 logitos y por fuera de los límites de acuerdo de Bland y Altman (1986).
Las dificultades de los ítems del MMSE en los adultos mayores de Antioquia fueron comparadas con las reportadas por Prieto et al. en Castilla y León, España, en 2011 para valorar la estabilidad del MMSE y sus posibilidades de comparación transcultural.
Unidimensionalidad, Confiabilidad y mapa de Wright
La unidimensionalidad de la medida Rasch derivada del MMSE se determinó mediante dos criterios: a) varianza explicada por la medida mayor a 40% (Bond, 2004), y b) varianza explicada por el contraste residual más importante menor a 10%. Se verificó la correlación disatenuada entre la medida Rasch y el primer contraste con valor esperado mayor a 0,50 (Wolfe & Smith, 2007).
Se calcularon la confiabilidad (Rasch reliability) e índice de separación para los ítems y las personas, al igual que la consistencia interna de las puntuaciones crudas. Se presenta el mapa de Wright y sobre este se analiza el targeting de la escala con respecto a la distribución de las habilidades de los participantes.
Los análisis se realizaron en Winsteps 3.92.1 (Linacre, 2016) y Stata 12 (StataCorp, 2011).
Resultados
La población estudiada (Tabla 1) correspondió a 4034 personas mayores, la mitad registró una edad de 70 años, 60% población femenina, residentes principalmente en la zona urbana y predominio de mestizos. Es llamativo que solo un tercio de los adultos mayores reportó haberse enfermado o consultar a los servicios médicos en los últimos cuatro meses de la aplicación de la encuesta.
Tabla 1 Características sociodemográficas de adultos mayores participantes. Antioquia, Colombia 2012
Variable | N | % | ||
---|---|---|---|---|
Sexo | Hombre | 1549 | 38,40 | |
Mujer | 2485 | 61,60 | ||
Área de residencia | Urbana | 3712 | 92,00 | |
Rural | 322 | 8,00 | ||
Etnia | Mestizo | 3458 | 85,70 | |
Otro | 576 | 14,30 | ||
Enfermedades reportadas en los últimos cuatro meses | Sí | 2783 | 69,00 | |
No | 1251 | 31,00 | ||
Edad | Mediana | 70 (64-77) |
Ajuste y funcionamiento diferencial de los ítems (DIF)
Todos los ítems muestran medias cuadráticas de Outfit en el rango 0,53 - 1,87 y medias cuadráticas Infit en el rango 0,63-1,38. Las correlaciones ítem medida son mayores a 0,30 excepto para los ítems Orientación temporal 2, Orientación espacial 1, y Lenguaje 1. La Tabla 2 muestra los estadísticos de ajuste y las dificultades de los ítems con sus errores estándar expresados en logitos.
Tabla 2 Estadísticos de los ítems del MMSE en adultos mayores de Antioquia, Colombia 2012
Ítem | Dificultad | Error estándar | Outfit | Infit | Correlación ítem-medida |
---|---|---|---|---|---|
OT1. Orientación temporal 1 | 0,50 | 0,04 | 1,00 | 0,98 | 0,48 |
OT2. Orientación temporal 2 | -2,41 | 0,10 | 1,51 | 1,01 | 0,26 |
OT3. Orientación temporal 3 | 0,80 | 0,04 | 1,29 | 1,12 | 0,42 |
OT4. Orientación temporal 4 | -0,66 | 0,05 | 0,85 | 0,89 | 0,44 |
OT5. Orientación temporal 5 | -0,42 | 0,05 | 0,80 | 0,89 | 0,46 |
OE1. Orientación espacial 1 | -0,88 | 0,06 | 1,87 | 1,25 | 0,23 |
OE2. Orientación espacial 2 | 0,17 | 0,04 | 1,22 | 1,09 | 0,40 |
OE3. Orientación espacial 3 | -0,24 | 0,05 | 0,89 | 0,95 | 0,45 |
OE4. Orientación espacial 4 | -1,50 | 0,07 | 1,36 | 1,04 | 0,29 |
OE5. Orientación espacial 5 | -2,20 | 0,09 | 0,84 | 0,93 | 0,32 |
OE6. Orientación espacial 6 | -2,16 | 0,09 | 0,85 | 0,99 | 0,30 |
MF1. Memoria de fijación 1 | -2,61 | 0,10 | 0,64 | 0,90 | 0,31 |
MF2. Memoria de fijación 2 | -1,69 | 0,07 | 1,01 | 0,91 | 0,35 |
MF3. Memoria de fijación 3 | -1,39 | 0,07 | 0,79 | 0,93 | 0,38 |
AC1. Atención y cálculo 1 | 2,53 | 0,04 | 0,76 | 0,84 | 0,63 |
AC2. Atención y cálculo 2 | 1,98 | 0,04 | 0,63 | 0,71 | 0,69 |
AC3. Atención y cálculo 3 | 1,57 | 0,04 | 0,55 | 0,65 | 0,71 |
AC4. Atención y cálculo 4 | 1,43 | 0,04 | 0,53 | 0,63 | 0,72 |
AC5. Atención y cálculo 5 | 1,37 | 0,04 | 0,53 | 0,64 | 0,71 |
ME1. Memoria de evocación 1 | 1,55 | 0,04 | 1,36 | 1,30 | 0,38 |
ME2. Memoria de evocación 2 | 2,82 | 0,04 | 1,64 | 1,38 | 0,34 |
ME3. Memoria de evocación 3 | 2,43 | 0,04 | 1,43 | 1,29 | 0,40 |
LE1. Lenguaje 1 | -1,68 | 0,07 | 1,11 | 1,23 | 0,27 |
LE2. Lenguaje 2 | -0,65 | 0,05 | 1,16 | 1,02 | 0,37 |
LE3. Lenguaje 3 | 0,07 | 0,04 | 1,24 | 1,03 | 0,42 |
LE4. Lenguaje 4 | -0,13 | 0,03 | 0,81 | 1,24 | 0,46 |
LE5. Lenguaje 5 | 1,39 | 0,04 | 1,30 | 1,14 | 0,45 |
Se identificaron problemas de dependencia local ente las tareas de Atención y cálculo con correlaciones entre residuales de los ítems 4 y 5 (r= 0,95), 3 y 4 (r=0,90) 3 y 5 (r=0,86). 2 y 3(r=0,74) y 1 y 2 (r= 0,70).
La Figura 1 muestra los Límites de acuerdo de Bland y Altman por edad (Figura 1a), sexo (Figura 1b), reporte de enfermedad (Figura 1c) y la comparación de las dificultades de los ítems obtenidas para los adultos mayores de Antioquia con las reportadas por Prieto et al., 2011 para adultos mayores de Castilla y León, España. En las figuras los ítems con DIF significativo y relevante son aquellos ubicados por fuera de los Límites de acuerdo de Bland y Altman (verde) y de las líneas de referencia vertical ubicadas en los valores ±0,5 logitos (negro).
![](/img/revistas/cesp/v10n2//2011-3080-cesp-10-02-00017-gf1.jpg)
Figura 1 Funcionamiento diferencial de los ítems del MMSE en adultos mayores de Antioquia, Colombia 2012 Líneas verdes: Límites de acuerdo de Bland y Altman, Línea roja: Promedio de las diferencias de dificultades por subgrupo, todos los ítems. Las diferencias (eje vertical) y promedios (eje horizontal) de dificultades de los ítems están expresados en logitos. Los nombres cortos de los ítems se corresponden con los presentados en la Tabla 2.
La dificultad de los ítems relacionados con atención y cálculo (AC1-AC5) y con lenguaje (LE1, LE4, LE5) es significativamente mayor para los adultos menores de 70 años; por el contrario, las dificultades de los ítems relacionados con orientación espacial (OT1, OE2, OE3) y temporal (OT3, OT4) son más altas entre los adultos mayores de 70 años que entre los menores. En general, las dificultades de los ítems relacionados con memoria no difieren por grupos de edad. Únicamente la diferencia en OT1 es mayor a 0,5 logitos. Por sexo, se observa una mayor dificultad para los hombres en los ítems relacionados con lenguaje (LE2, LE3) y memoria de evocación (ME1-ME3) y para las mujeres en los ítems relacionados con orientación espacial (OE2-OE4) y atención y cálculo (AC1-AC5). Entre las diferencias por sexo, el contraste es mayor a 0,50 logitos únicamente para los ítems de orientación espacial en contra de las mujeres. Al comparar las dificultades según reporte de enfermedad no se observan diferencias relevantes.
En relación con la comparación entre las dificultades encontradas en Antioquia y las reportadas en Castilla y León se observan pocos ítems con valores similares. El acuerdo entre medidas se da principalmente en ítems relacionados con tareas de memoria de fijación y orientación espacial y temporal. Para los adultos mayores de Antioquia la mayoría de las tareas relacionadas con el lenguaje implicaron mayor dificultad que para los adultos mayores de Castilla y León. Por el contrario, para los adultos mayores de esta región, la dificultad es mayor en las tareas de atención y cálculo y de orientación espacial en comparación con los adultos mayores de Antioquia.
Unidimensionalidad, confiabilidad y mapa de Wright
Se obtuvo un valor de 0,80 para la confiabilidad tanto de los ítems como de las personas, lo cual implica un índice de separación de 2. La consistencia interna de las puntuaciones brutas fue de 0,85. La medida Rasch construida a partir del MMSE explicó el 45,20% de la varianza de las puntuaciones crudas. A partir del análisis de componentes principales realizado sobre los residuales de esta medida se encontró que el primer contraste explicó el 9,60% de la varianza residual y mostró una correlación disatenuada de 0,32 con respecto a la medida principal. Al revisar la composición de este contraste, se identificó que su primer clúster con cargas factoriales positivas y mayores a 0,50 estaba compuesto por los ítems de atención y cálculo.
La Figura 2 muestra el mapa de Wright para el MMSE. Se observa que el nivel promedio de habilidad de los adultos mayores (M izquierda) es mayor que el valor promedio más una desviación estándar de las dificultades de los ítems de la escala (S derecha). Este desfase entre distribuciones implica a su vez que las medidas de atributo mayores a aproximadamente 3 logitos (≥27 en puntuación cruda) no cuentan con ítems de dificultad suficiente para ser caracterizadas. El 4,2% (168) de los adultos mayores obtuvo la puntuación máxima posible y el 0,3% (11) la puntuación mínima posible. En el mapa también se observa que los ítems que implican mayor dificultad son los relacionados con memoria de evocación y con atención y cálculo con dificultades mayores a 1,00 logito.
Discusión
El propósito de esta investigación fue evaluar las evidencias de validez del Mini Mental State Examination siguiendo la metodología de Wolfe y Smith (2007) para análisis desde el modelo de Rasch. A continuación, se presentan las interpretaciones de los resultados por facetas de validez según propuesta de Messick (1995).
Validez sustantiva. El rango de puntuaciones del MMSE fue suficiente dado que en conjunto menos del 5% de los adultos mayores obtuvo las puntaciones extremas de 0 y 30 puntos. La jerarquía de los ítems reflejada en el mapa de Wright se comporta conforme a lo esperado según otros estudios que han identificado como las tareas relacionadas con procesos de atención y memoria conllevan mayor dificultad que tareas que involucran otros procesos cognitivos (Fliss, Lemerre, & Mollard, 2016; Requena, Turrero, & Ortiz, 2016). No obstante, el rango de dificultad de los ítems fue insuficiente para describir apropiadamente el nivel de habilidad de los adultos mayores con puntuación cruda ≥ 27. Si bien el MMSE suele interpretarse con base en puntos de corte menores a este valor, se requiere identificar nuevos ítems con dificultad mayor a los ítems que actualmente conforman el instrumento para poder caracterizar apropiadamente el estado cognitivo de los adultos mayores que logran mayor desempeño en el MMSE.
Validez de contenido. Si bien, como se comentó en el párrafo anterior, la posición en el mapa de Wright de los ítems relacionados con atención y cálculo es acorde a la jerarquía de los ítems, estos mostraron dependencia local entre sí violando uno de los supuestos más relevantes del modelo de Rasch (Engelhard, 2013). Una alternativa viable para evitar este problema sería buscar un sistema de calificación conjunta a partir de los cinco ítems. Las medias cuadráticas Outfit e Infit obtenidas sugieren ajuste apropiado de los ítems al modelo. Su interpretación debe hacerse con precaución a razón de la dependencia local.
Validez estructural. La medida logró explicar más del 40% de la varianza de las puntuaciones brutas, criterio planteado en la literatura como suficiente (Bond & Fox, 2001). No obstante, el primer contraste entre los residuales, el cual se conforma de los ítems de Atención y cálculo, mostró muy baja correlación disatenuada con la medida principal consolidándose como una segunda medida independiente y relevante obtenida a partir del MMSE en adultos mayores. En este punto es importante aclarar que las medidas construidas desde el modelo de Rasch son unidimensionales por propiedades de la medición conjunta, la segunda medida que se identificó surge de los residuales de la medida principal (Engelhard, 2013). Sin embargo, dadas las condiciones de dependencia local de los ítems de Atención y Cálculo es difícil determinar la validez de generar una segunda medida a partir del MMSE relacionada con estos procesos, la cual sea complementaria a la medida de funcionamiento general que originalmente propone el instrumento. Teóricamente, dada la importancia de las funciones de memoria en la evaluación del adulto mayor, ésta pudiese ser una alternativa válida y útil (Creavin et al., 2016). Se sugiere explorar esta situación con mayor detalle en futuras investigaciones.
Validez de generalización. La confiabilidad y consistencia interna fueron moderadas permitiendo separar la información de personas e ítems en dos estratos. Se identificaron varios ítems con DIF entre subgrupos de edad con corte a 70 años y entre sexos, los cuales fueron estadísticamente significativos, pero de poca relevancia clínica. No obstante, dado que los ítems que difieren en dificultad entre estos dos grupos se separan con cierta claridad según el proceso psicológico involucrado en la tarea, es necesario revisar la posibilidad de generalización del instrumento desde su definición operacional. Por otra parte, de la comparación de las dificultades del MMSE en Antioquia con las reportadas en Castilla y León se concluye que el MMSE parece ser un instrumento limitado para los propósitos de las comparaciones transculturales. Como lo planteó Carnero-Pardo en 2014, posiblemente pueda identificarse una forma corta que retome los ítems con mejores evidencias de validez que produzcan resultados más robustos y comparables entre países y otros grupos relevantes. En este sentido resaltan algunos esfuerzos en Europa para mejorar la comparabilidad de este instrumento (Tennant et al., 2004).
La interpretación de los resultados debe contextualizarse en función de las limitaciones y fortalezas de la investigación. La etnia y el estado de salud fueron establecidos por auto-reporte de los adultos mayores, lo cual podría generar sesgos de información. No obstante esta limitación, los resultados obtenidos sobre funcionamiento diferencial por estas dos características son coherentes con la literatura.
Por otra parte, este trabajo tiene dos fortalezas principales. En primer lugar, se realizó desde el marco epistemológico y metodológico de la medición invariante, operacionalizado en el modelo de Rasch (Engelhard, 2013). En este sentido, es importante resaltar que, si bien cada vez son más frecuentes las publicaciones que recurren a los modelos de Rasch o de Teoría de la Respuesta al Ítem, son pocas las investigaciones que se realizan desde el enfoque contemporáneo de la validez. La fuerza de la psicometría contemporánea no radica exclusivamente en la sofisticación de sus técnicas, sino que se soporta principalmente en sus avances teóricos y epistemológicos en torno a la lógica de la validez y el concepto de medición (Kane, 2001). En segundo lugar, los análisis se realizaron sobre una muestra de gran tamaño, la cual fue obtenida de forma probabilística. Si bien por propiedades de objetividad específica los estadísticos de los ítems son independientes de la muestra (Fischer & Molenaar, 1995), haber recurrido a un muestreo probabilístico hace que el mapa de Wright sea informativo tanto por las locaciones de los ítems, como por la distribución de puntuaciones de los adultos mayores. Esto habilita los resultados derivados de esta investigación para usarse en interpretaciones normativas o basadas en criterio, mejorando la interpretabilidad clínica de los resultados obtenidos por un individuo en el MMSE (Stelmack et al., 2004).
En conclusión, es importante revisar los argumentos y evidencias en pro y en contra de sintetizar las capacidades cognitivas del adulto mayor en una única medida de desempeño global a la luz de los desarrollos recientes. Esto implica una revisión de la definición conceptual y operacional que sustenta el MMSE, principalmente por las limitaciones a su generalización transcultural y por subgrupos como las identificadas en esta investigación y en otros trabajos disponibles en la literatura. No obstante, el MMSE muestra argumentos suficientes para su uso con adultos mayores siempre y cuando se reconozcan sus limitaciones.