Adaptação, comparação e melhora de algoritmos metaheurísticos ao problema de etiquetado de partes do discurso

Solano-Jiménez, Miguel-Alexis; Tobar-Cifuentes, José-Julio; Sierra-Martínez Ph. D, Luz-Marina; Cobos-Lozada Ph. D, Carlos-Alberto

doi:10.19053/01211129.v29.n54.2020.11762

Serviços Personalizados

Journal

Artigo

Indicadores

Citado por SciELO
Acessos

Links relacionados

Citado por Google
Similares em SciELO
Similares em Google

Permalink

Revista Facultad de Ingeniería

versão impressa ISSN 0121-1129versão On-line ISSN 2357-5328

Resumo

SOLANO-JIMENEZ, Miguel-Alexis; TOBAR-CIFUENTES, José-Julio; SIERRA-MARTINEZ PH. D, Luz-Marina e COBOS-LOZADA PH. D, Carlos-Alberto. Adaptação, comparação e melhora de algoritmos metaheurísticos ao problema de etiquetado de partes do discurso. Rev. Fac. ing. [online]. 2020, vol.29, n.54, e11762. Epub 30-Dez-2020. ISSN 0121-1129. https://doi.org/10.19053/01211129.v29.n54.2020.11762.

A identificação de partes do discurso (Part-of-Speech Tagging, POST) é uma tarefa complexa nas aplicações de processamento de linguagem natural. Tem sido abordada desde enfoques baseados em informação estatística e regras, fazendo uso de distintos métodos e, ultimamente, destacam-se os algoritmos metaheurísticos obtendo bons resultados. Por isso, envolvem-se nesta pesquisa para assignar a melhor sequência de etiquetas (papéis) para as palavras de uma oração, baseando-se em informação estatística. Este processo desenvolveu-se em 2 ciclos, onde cada ciclo teve 4 fases para a adaptação ao problema de etiquetado nos algoritmos metaheurísticos Particle Swarm Optimization, Jaya, Random-Restart Hill Climbing, e um algoritmo mimético baseado em Global-Best Harmony Search como otimizador global, e em Hill Climbing como otimizador local. Realizaram-se experimentos preliminares (utilizando validação cruzada), para ajustar os parâmetros de cada algoritmo e depois executá-los sobre os datasets completos dos corpus etiquetados IULA (castelhano), Brown (inglês) e Nasa Yuwe (Nasa). Os resultados obtidos pelos etiquetadores propostos compararam-se mediante as provas estatísticas não paramétricas de Friedman e Wilcoxon, ratificando que o mimético proposto, GBHS Tagger, obtém melhores resultados de precisão. Os etiquetadores propostos convertem-se em um aporte muito importante para o POST, tanto para línguas tradicionais (Inglês e Castelhano), não tradicionais (Nasa Yuwe), e suas áreas de aplicação.

Palavras-chave : algoritmos heurísticos; computação evolutiva; etiquetado de partes do discurso; inteligência computacional; linguística computacional; métodos de busca; processamento de linguagem natural.

· resumo em Inglês | Espanhol · texto em Inglês · Inglês (

pdf )