Introducción
El envejecimiento suele caracterizarse por cambios biológicos, psicológicos y socioculturales 1. En algunos casos, este proceso evoluciona de manera patológica y ello se da como consecuencia del padecimiento de enfermedades físicas o mentales, con un profundo cambio en la autonomía del individuo. Un ejemplo de ello lo describe el deterioro cognitivo (DC), que impacta negativa y paulatinamente las funciones mentales, la personalidad y la sociabilidad del individuo 2,3.
El DC afecta en el mundo al 8 % de las personas mayores de 60 años, cifra que tiende a incrementarse con el fenómeno de envejecimiento poblacional 4,5. El grupo de trabajo del National Institute on Aging y la Alzheimer's Association han procurado revisar minuciosamente los criterios diagnósticos del DC, describiendo que se caracteriza por presentar déficits en una o más funciones cognitivas 6,11. En estadios demenciales se manifiesta como una enfermedad crónica y altamente incapacitante 12. El DC, en sus primeras etapas, se caracteriza por la afectación de la memoria episódica reciente y de la fluencia del lenguaje; pero, en etapas más avanzadas, las personas son incluso incapaces de mantener una conversación y responder ante su entorno 13,14.
Las alteraciones del lenguaje en el DC varían desde la disminución en la fluencia verbal, pasando por procesos alterados de lectoescritura y presencia de anomias, hasta profundas alteraciones en la comprensión 15,23. Por ejemplo, se han identificado alteraciones en la velocidad de la narración durante una conversación espontánea, y esto se ha relacionado con la reducción en la evocación de palabras y con un número mayor de silencios entre ellas 14,19,20,24,29. También se han descrito dificultades articulatorias tipo disartria, paráfrasis fonológicas o presencia de circunloquios al utilizar más palabras de las necesarias para expresar una idea, y se han relacionado con atrofia en las redes cerebrales motoras y del lenguaje 30,31,34. Los hallazgos sobre el análisis automático del lenguaje son prometedores en lo que respecta a la detección temprana del DC, ya que algunos de estos cambios se manifiestan sutilmente en etapas preclínicas del deterioro 24.
Dentro de los parámetros de medición de la voz se encuentran las mediciones de jitter, o variabilidad de la perturbación de las frecuencias por periodos de la voz, y de shimmer, o medición de la amplitud, volumen e intensidad de una onda; el APQ3, o cociente de perturbación de amplitud de tres puntos; el Mean Harmonic to Noise Ratio, o la relación armónico-ruido, referido a la medida que cuantifica la cantidad de ruido aditivo en la señal de la voz, y, finalmente, los parámetros del cepstrum, que aportan información sobre el ritmo de cambio en las diferentes bandas del espectro acústico. En específico, se mide el Smoothed Cepstral Peak Prominence, prominencia del pico cepstral suavizado, el cual representa la diferencia entre el pico cepstral más prominente y el punto con la misma frecuencia 35,41.
Estudios recientes han mostrado interés en el análisis acústico del lenguaje, especialmente en el estudio de los rasgos suprasegmentales prosódicos del habla, como son la entonación y el ritmo, y han identificado marcadores clave para el diagnóstico precoz del deterioro cognitivo 34,42. Los estudios de análisis acústico o en los parámetros de la voz en el DC son recientes y se han fundamentado bajo la hipótesis de que dentro de las alteraciones del lenguaje también se presentan cambios en la prosodia, o sea, la variación sonora, el tono y el tiempo que acompaña al habla natural y la voz 43. Ballard et al. han asociado estos cambios con la pérdida de masa muscular, degeneración y disminución de las fibras de órganos que intervienen en la producción del habla, por ejemplo, la laringe 32,44. Esta estructura, en conjunto con otros órganos de la cavidad oral (labios, lengua y boca), permite el mecanismo de fonación en los sonidos que emitimos a través de la voz y que se presentan en algunos estadios del deterioro cognitivo. Así mismo, Hernández et al. sugieren que las medidas basadas en F0 tienen la limitación de requerir la detección exacta de los ciclos de la F0, lo que disminuye su fiabilidad en voces con algún grado de disfonía, por lo que recomiendan el análisis de la prominencia del pico cepstral, una medida de la periodicidad armónica espectral que no requiere mediciones exactas de la F0, aun en las voces disfónicas 45,49. Además de lo anterior, es imperativo destacar que en este proceso de medición las emociones también desempeñan un papel fundamental, ya que pueden afectar la frecuencia fundamental o tono 19,24.
Por otro lado, estudios de medición de la actividad electromiográfica de la laringe han mostrado una reducción en las tasas de disparo en el músculo tirohioideo de las personas mayores, lo que explicaría en parte los cambios producidos en la voz 32,33. Estos hallazgos son prometedores en el estudio de nuevos marcadores clínico-patológicos asociados al deterioro cognitivo en sus fases asintomáticas, deterioro leve y demencia. Por lo anterior, el propósito de este estudio fue identificar en la literatura hallazgos relevantes sobre el análisis acústico en personas mayores con deterioro cognitivo.
Materiales y métodos
El método aplicado para este estudio se basó en los parámetros PRISMA 50. Se llevó a cabo un estudio de revisión sistemática de la literatura sobre los hallazgos del análisis acústico en el DC. Dos evaluadores independientes calcularon el riesgo de sesgo y consultaron los resúmenes publicados entre febrero del 2008 y julio del 2020 en las siguientes bases de datos: PlosOne, Science Direct, Pubmed/PMC y Google Scholar, tanto en inglés como en español. Los metabuscadores fueron: voice analysis, acoustic analysis, mild cognitive impairment, Alzheimer's disease, voice production y prosody; todos incluidos en los descriptores en Ciencias de la salud (DeCS). Se encontraron 59 publicaciones científicas en idioma inglés y español, de las cuales solo 25 cumplieron con los criterios de inclusión (figura 1).
Los autores extrajeron los datos utilizando una matriz de Excel, donde se describió el contenido de los artículos seleccionados, incluyendo autores, título, objetivo del estudio, material y métodos, resultados y conclusiones. Después se leyeron los títulos y resúmenes de los artículos, considerando los criterios de inclusión. Adicionalmente, leyeron de forma completa todos los estudios para corroborar la claridad de los resultados. Se incluyeron estudios de comparación entre grupos, casos y controles y de desarrollo tecnológico que hubieran realizado análisis acústico en población con DC (tabla 1) y enfermedad de Alzheimer (tabla 2). Por último, se consultó un tercer evaluador que corroboró la calidad de la información.
Tabla 1 Publicaciones de análisis acústico en deterioro cognitivo
![](/img/revistas/recis/v19n3//2145-4507-recis-19-03-105-gt1.png)
* Objetivo: analizar en personas diagnosticadas con DC y enfermedad de Alzheimer (EA).
AUC: área bajo la curva o area under curve, por sus siglas en inglés; SCI: deterioro cognitivo subjetivo; DM: demencia mixta.
Resultados
La evaluación tradicional de los parámetros de la voz se encuentra detallada en las tablas 1 y 2. Los parámetros más simples y utilizados incluyen la medición de la frecuencia fundamental media (F0). La media de la F0 nos muestra el tono promedio de la voz de una persona, si esta es aguda o grave. También suele estimarse la desviación estándar de la frecuencia fundamental (DE F0), que hace referencia a la variabilidad de la F0 en los cambios patológicos de la voz; por ejemplo, se evidencian valores anormales de F0, debido quizá a un exceso de esfuerzo de la musculatura laríngea o a un aumento de la densidad de la cubierta de las cuerdas vocales, que aportan valores más bajos de F0 de los esperados.
Estas mediciones permiten distinguir el cambio sistemático en la magnitud de las respuestas vocales F0 asociados a la edad o una patología específica; por ejemplo: dichas respuestas aumentan gradualmente y alcanzan el valor máximo en el rango entre los 51 y los 60 años, y luego disminuyen entre los 61 y los 75 años. Estos cambios se consideran normales y asociados con la edad. En las tablas 1 y 2 se presenta un resumen corto del método y de los resultados encontrados de los 25 artículos utilizados para esta revisión.
Discusión
Esta revisión evidenció que el análisis de la voz bajo un enfoque de tareas lingüísticas múltiples y de complejidad variada es prometedor para la discriminación diagnóstica del DC 14,52,53,55,65. Se identificaron perfiles específicos de alteración sonora para los individuos con DC y el perfil incluye mayor número de periodos en los que la voz vibra a menos ciclos por segundo, una voz más profunda, más lenta y pulsos glóticos lentos o variación brusca de la presión del aire cuando las cuerdas vocales se unen para formar un cierre completo. Ello da como resultado una tonalidad de la voz monótona y la aparición de ruidos característicos relacionados con voces temblorosas, con menos intensidad y menor control del flujo del aire 27.
Los estudios de Meilán et al. lograron identificar ocho parámetros importantes relacionados con alteraciones en la voz correspondientes a individuos con DC: a) porcentaje del periodo sin emisión de sonido, b) brillan Apqll, c) brillan Apq3, d) número de saltos de voz, e) desviación estándar de F3, f) edad, g) relación de ruido armónico y autocorrelación y h) discriminación del tipo de participantes -en el 91.2 % de los casos; 90.05 % en la validación cruzada- 27,28,39. Estos parámetros lograron discriminar a los participantes con envejecimiento normal y Alzheimer hasta en un 97 %, y con DC, en más del 76.3 °% de los casos 35,38-40. Resultados similares se evidenciaron en otros estudios con un 96 % a 75 % de precisión diagnóstica 14,41,52. Igualmente, se debe resaltar que los estudios del análisis acústico han resultado ser útiles en la correspondencia con otras alteraciones neurológicas, como el Párkinson, la esquizofrenia, la enfermedad de Huntington, la demencia frontotemporal y la demencia con cuerpos de Lewy, y constituyen una medición prometedora, económica y rápida para el apoyo de la evaluación clínica tradicional de diversos trastornos psiquiátricos 13,21,43,44,51,52,55,56,60,61,65. Pese a lo anterior, la mayor parte de los estudios revisados fueron de mediciones transversales, de casos y controles, que devienen en una limitación metodológica a la hora de generalizar los resultados, a lo que se sugerirían estudios de seguimiento de cohorte con mediciones repetidas, que aseguren con mayor precisión la predicción y clasificación diagnóstica.
Los perfiles clínicos generados por el análisis acústico podrán ser de gran utilidad y son prometedores en el momento de una clasificación rápida en la consulta clínica, al convertirse en una herramienta más que apoya el diagnóstico dentro de una evaluación integral del DC y la enfermedad de Alzheimer en estadios tempranos o como un biomarcador diagnóstico. Sin embargo, no podría utilizarse como único criterio diagnóstico, dada la complejidad sintomática de estas patologías.
Así mismo, algunos aspectos que podrían mejorar la generalización de los resultados en estos estudios predictivos serían mediciones acústicas en escenarios de lenguaje espontáneo o menos controlados, ya que, especialmente en pacientes con un deterioro en curso, el análisis en laboratorios acústicos y bajo estímulos controlados puede producirles estrés 3,25,26,29 y modificar el resultado en la producción del lenguaje, o también generar alteraciones fonológicas, en el ritmo, la tonalidad y espacios entre las palabras, que variarían los parámetros de producción de la voz 27,52,54,57,58,61,66. Además de lo anterior, no se han realizado comparaciones en estas mediciones en pacientes con diferentes idiomas y acentos, para determinar si estas características podrían influir en características acústicas específicas dentro de los análisis.
El análisis automático del habla, al ser una medida objetiva, económica, simple y no invasiva, es una herramienta útil para proporcionar indicadores adicionales al proceso evaluativo y diagnóstico de la DC y el deterioro cognitivo leve 52,53,55-57,63,65. Estas mediciones disminuyen sesgos comunes de la evaluación clínica tradicional basada en el uso de test cognitivos, dado que el idioma, la cultura y el grado de experticia y subjetividad del evaluador no afectan en ningún sentido los protocolos de medición de la voz 13,19,27,29,45,51. Los estudios revisados aportan a la identificación de diferentes perfiles con parámetros confiables de alteración en la voz y el habla, correspondientes a deterioro cognitivo leve, demencia y envejecimiento normal. Estos hallazgos suman a los criterios clínico-patológicos asociados con el DC y deberían considerarse en un proceso de diagnóstico clínico. Sin embargo, a pesar de las ventajas de estas mediciones, se requieren más estudios cuyos resultados logren ser representativos y definitivos, con mayor robustez metodológica, que contemplen un número mayor de casos analizados, estudios de seguimiento (longitudinales) y protocolos libres de sesgos culturales del idioma.