SciELO - Scientific Electronic Library Online

 
vol.26 número72Environmental, Biological, and Fishing Factors Influencing Fish Mortality and Development of the Cachirra event, Navío Quebrao LagoonDesign of a simulation model that represents the collective intelligence genome of (malone et al., 2010) índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Em processo de indexaçãoCitado por Google
  • Não possue artigos similaresSimilares em SciELO
  • Em processo de indexaçãoSimilares em Google

Compartilhar


Tecnura

versão impressa ISSN 0123-921X

Resumo

CONTRERAS CONTRERAS, Ghiordy Ferney; MEDINA DELGADO, Byron; ACEVEDO JAIMES, Brayan René  e  GUEVARA IBARRA, Dinael. Metodología de desarrollo de técnicas de agrupamiento de datos usando aprendizaje automático. Tecnura [online]. 2022, vol.26, n.72, pp.42-58.  Epub 18-Jun-2022. ISSN 0123-921X.  https://doi.org/10.14483/22487638.17246.

Contexto:

Hoy en día, el uso de grandes cantidades de datos adquiridos desde diversos dispositivos y equipos electrónicos, ópticos u otra tecnología de medición, generan un problema de análisis de datos en el momento de extraer la información de interés desde las muestras adquiridas. En ellos, agrupar correctamente los datos es necesario para obtener información relevante y precisa para evidenciar el fenómeno físico que se desea abordar.

Metodología:

El trabajo presenta la evolución de una metodología de cinco etapas para el desarrollo de una técnica de agrupamiento de datos, a través de técnicas de aprendizaje automático e inteligencia artificial. Esta se compone de cinco fases denominadas análisis, diseño, desarrollo, evaluación y distribución, con estándares de código abierto y fundamentadas en los lenguajes unificados para la interpretación del software en ingeniería.

Resultados:

La validación de la metodología se ha desarrollado mediante la creación de dos métodos de análisis de datos, con un tiempo de ejecución promedio de 20 semanas, obteniendo valores de precisión 40 % y 29 % superiores con los algoritmos clásicos de agrupamiento de datos de k-means y fuzzy c-means. Adicionalmente, se encuentra una metodología de experimentación masiva sobre pruebas unitarias automatizadas, las cuales lograron agrupar, etiquetar y validar 3,6 millones de muestras, acumulado un total de 100 ejecuciones de grupos de 900 muestras, en aproximadamente 2 horas.

Conclusiones:

Con los resultados de la investigación se ha determinado que la metodología pretende orientar el desarrollo sistemático de técnicas de agrupamiento de datos, en problemas específicos para bases integradas por muestras con atributos cuantitativos, como los casos de parámetros de canal en un sistema de comunicaciones o la segmentación de imágenes usando los valoras RGB de los pixeles; incluso, cuando se desarrolla software y hardware, la ejecución será más versátil que en casos con aplicaciones teóricas.

Financiamiento:

Universidad Francisco de Paula Santander y Univeridade Federal de Minas Gerais.

Palavras-chave : análisis de datos; automatización; algoritmo; software de código abierto.

        · resumo em Inglês     · texto em Espanhol     · Espanhol ( pdf )