SciELO - Scientific Electronic Library Online

 
vol.26 issue44Best practices of interoperability among heterogeneous software systems: a Semat-based representation author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Revista Facultad de Ingeniería

Print version ISSN 0121-1129

Abstract

CAMACHO, Francy Liliana; TORRES-SAEZ, Rodrigo  and  RAMOS-POLLAN, Raúl. Avaliação do comportamento de métodos de machine learning para predizer a atividade de peptídeos antimicrobianos. Rev. Fac. ing. [online]. 2017, vol.26, n.44, pp.167-180. ISSN 0121-1129.  http://dx.doi.org/10.19053/01211129.v26.n44.2017.5834.

Este trabalho demonstra a importância de obter resultados estatisticamente estáveis quando empregam-se métodos de aprendizagem computacional para predizer a atividade de peptídeos antimicrobianos onde, devido ao custo e à complexidade dos processos químicos, os conjuntos de dados são particularmente pequenos (menos de algumas centenas de instâncias). Igualmente, em outros campos com problemas similares, isto produz grandes variabilidades no rendimento dos modelos preditivos, o que dificulta qualquer intento por transferi-los à prática. Consequentemente, ao contrario de outros trabalhos que reportam rendimentos preditivos máximos obtidos em configurações experimentais muito particulares, enfocamo-nos em caracterizar o comportamento dos métodos de aprendizagem de máquina, como passo prévio para obter resultados reproduzíveis, estatisticamente estáveis e, finalmente, com uma capacidade preditiva competitiva. Para este propósito, desenhou-se uma metodologia que integra a aprendizagem de características (autoencoders) e métodos de seleção (algoritmos genéticos) através do uso exaustivo de métricas de rendimento (teste de permutações e bootstrapping), permitindo obter a evidência estatística suficiente como para suportar a tomada de decisões de inversão com os recursos disponíveis do laboratório. Neste trabalho mostra-se evidência da utilidade de: 1) o uso extensivo dos recursos computacionais e 2) a adoção de uma gama mais ampla de métricas que as reportadas na literatura para avaliar o funcionamento dos métodos. Este enfoque permitiu orientar a busca de métodos de aprendizagem de máquina adequados e, além disso, obter resultados comparáveis aos da literatura com uma grande estabilidade estatística.

Keywords : Peptídeos antimicrobianos; Aprendizagem de máquina; Estabilidade estatística; Regressão de Vetores de Suporte; Curvas de aprendizagem.

        · abstract in English | Spanish     · text in English     · English ( pdf )