SciELO - Scientific Electronic Library Online

 
vol.41 número2Diferenças de sexo associadas ao suicídio e anos potenciais de vida perdidos: um estudo retrospectivoCrenças e práticas para a atenção à saúde de pessoas surdas em Antioquia índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Em processo de indexaçãoCitado por Google
  • Não possue artigos similaresSimilares em SciELO
  • Em processo de indexaçãoSimilares em Google

Compartilhar


Revista Facultad Nacional de Salud Pública

versão impressa ISSN 0120-386Xversão On-line ISSN 2256-3334

Resumo

MEJIA, Jessner Alexander; OVIEDO-BENALCAZAR, Mario Andrés; ORDONEZ, José Armando  e  VALENCIA-MURILLO, José Fernando. Aprendizaje automático aplicado a la predicción de diabetes mellitus, utilizando información socioeconómica y ambiental de usuarios del sistema de salud. Rev. Fac. Nac. Salud Pública [online]. 2023, vol.41, n.2, e06.  Epub 15-Nov-2023. ISSN 0120-386X.  https://doi.org/10.17533/udea.rfnsp.e351168.

Objetivo:

Se propuso aplicar modelos basados en técnicas de aprendizaje automático como apoyo para el diagnóstico temprano de la diabetes mellitus, utilizando variables de datos ambientales, sociales, económicos y sanitarios, sin la dependencia de la toma de muestras clínicas.

Metodología:

Se utilizaron datos de 10 889 usuarios afiliados al régimen subsidiado de salud de la zona suroccidental en Colombia, diagnosticados con hipertensión y agrupados en usuarios sin (74,3 %) y con (25,7 %) diabetes mellitus. Se entrenaron modelos supervisados utilizando k vecinos más cercanos, árboles de decisión y bosques aleatorios, así como modelos basados en ensambles, aplicados a la base de datos antes y después de balancear el número de casos en cada grupo de diagnóstico. Se evalúo el rendimiento de los algoritmos mediante la división de la base de datos en datos de entreno y de prueba (70/30, respectivamente), y se utilizaron métricas de exactitud, sensibilidad, especificidad y área bajo la curva.

Resultados:

Los valores de sensibilidad aumentaron considerablemente al utilizar datos balanceados, pasando de valores máximos del 17,1 % (datos sin balancear) a valores de hasta 57,4 % (datos balanceados). El valor más alto de área bajo la curva (0,61) fue obtenido con los modelos de ensambles, al aplicar un balance en el número de datos por cada grupo y al codificar las variables categóricas. Las variables de mayor peso estuvieron asociadas con aspectos hereditarios (24,65 %) y con el grupo étnico (5.59 %), además de la dificultad visual, el bajo consumo de agua, una dieta baja en frutas y verduras, y el consumo de sal y azúcar.

Conclusiones:

Aunque los modelos predictivos, utilizando información socioeconómica y ambiental de las personas, surgen como una herramienta para el diagnóstico temprano de la diabetes mellitus, estos aún deben ser mejorados en su capacidad predictiva.

Palavras-chave : aprendizaje automático; diabetes mellitus; factores ambientales; factores socioeconómicos; modelo predictivo.

        · resumo em Português | Inglês     · texto em Espanhol     · Espanhol ( pdf )