SciELO - Scientific Electronic Library Online

 
vol.29 issue54Driver-Assistant System Using Computer Vision and Machine LearningSAM: Preliminary Hybrid Model to Support Agile Large-Scale Transformation in Software Industries author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Revista Facultad de Ingeniería

Print version ISSN 0121-1129On-line version ISSN 2357-5328

Abstract

SOLANO-JIMENEZ, Miguel-Alexis; TOBAR-CIFUENTES, José-Julio; SIERRA-MARTINEZ PH. D, Luz-Marina  and  COBOS-LOZADA PH. D, Carlos-Alberto. Adaptação, comparação e melhora de algoritmos metaheurísticos ao problema de etiquetado de partes do discurso. Rev. Fac. ing. [online]. 2020, vol.29, n.54, e11762.  Epub Dec 30, 2020. ISSN 0121-1129.  https://doi.org/10.19053/01211129.v29.n54.2020.11762.

A identificação de partes do discurso (Part-of-Speech Tagging, POST) é uma tarefa complexa nas aplicações de processamento de linguagem natural. Tem sido abordada desde enfoques baseados em informação estatística e regras, fazendo uso de distintos métodos e, ultimamente, destacam-se os algoritmos metaheurísticos obtendo bons resultados. Por isso, envolvem-se nesta pesquisa para assignar a melhor sequência de etiquetas (papéis) para as palavras de uma oração, baseando-se em informação estatística. Este processo desenvolveu-se em 2 ciclos, onde cada ciclo teve 4 fases para a adaptação ao problema de etiquetado nos algoritmos metaheurísticos Particle Swarm Optimization, Jaya, Random-Restart Hill Climbing, e um algoritmo mimético baseado em Global-Best Harmony Search como otimizador global, e em Hill Climbing como otimizador local. Realizaram-se experimentos preliminares (utilizando validação cruzada), para ajustar os parâmetros de cada algoritmo e depois executá-los sobre os datasets completos dos corpus etiquetados IULA (castelhano), Brown (inglês) e Nasa Yuwe (Nasa). Os resultados obtidos pelos etiquetadores propostos compararam-se mediante as provas estatísticas não paramétricas de Friedman e Wilcoxon, ratificando que o mimético proposto, GBHS Tagger, obtém melhores resultados de precisão. Os etiquetadores propostos convertem-se em um aporte muito importante para o POST, tanto para línguas tradicionais (Inglês e Castelhano), não tradicionais (Nasa Yuwe), e suas áreas de aplicação.

Keywords : algoritmos heurísticos; computação evolutiva; etiquetado de partes do discurso; inteligência computacional; linguística computacional; métodos de busca; processamento de linguagem natural.

        · abstract in English | Spanish     · text in English     · English ( pdf )