SciELO - Scientific Electronic Library Online

 
 issue79Estimation of the neuromodulation parameters from the planned volume of tissue activated in deep brain stimulationAutomatic segmentation of lizard spots using an active contour model author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Revista Facultad de Ingeniería Universidad de Antioquia

Print version ISSN 0120-6230

Abstract

JARAMILLO-GARZON, Jorge Alberto; CASTELLANOS-DOMINGUEZ, César Germán  and  PERERA-LLUNA, Alexandre. Aplicabilidad de las suposiciones del aprendizaje semi-supervisado para la predicción de términos de la ontología genética. Rev.fac.ing.univ. Antioquia [online]. 2016, n.79, pp.19-32. ISSN 0120-6230.  http://dx.doi.org/10.17533/udea.redin.n79a03.

La Ontología Genética (GO) es uno de los recursos más importantes en la bioinformática, el cual busca proporcionar un marco de trabajo unificado para la anotación biológica de genes y proteínas de todas las especies. La predicción de términos GO es una tarea esencial en bioinformática, pero el número de secuencias etiquetadas que se encuentran disponibles es insuficiente en muchos casos para entrenar sistemas confiables de aprendizaje de máquina. El aprendizaje semi-supervisado aparece entonces como una poderosa solución que explota la información contenida en los datos no etiquetados, con el fin de mejorar las estimaciones de las aplicaciones supervisadas tradicionales. Sin embargo, los métodos semi-supervisados deben hacer suposiciones fuertes sobre la naturaleza de los datos de entrenamiento y, por lo tanto, el desempeño de los predictores es altamente dependiente de estas suposiciones. En este artículo se presenta un análisis de la aplicabilidad de las diferentes suposiciones del aprendizaje semi-supervisado en la tarea específica de predicción de términos GO, con el fin de proveer elementos de juicio que permitan escoger las herramientas más adecuadas para términos GO específicos. Los resultados muestran que los métodos semi-supervisados superan significativamente a los métodos tradicionales supervisados y que los desempeños más altos son alcanzados cuando se implementa la suposición de cluster. Además se comprueba experimentalmente que las suposiciones de cluster y manifold son complementarias entre sí y se realiza un análisis de cuáles términos GO pueden ser más susceptibles de ser correctamente predichos usando cada una de éstas.

Keywords : Aprendizaje semi-supervisado; ontología a genética; máquinas de vectores de soporte; predicción de funciones proteicas.

        · abstract in English     · text in English     · English ( pdf )