Services on Demand
Journal
Article
Indicators
- Cited by SciELO
- Access statistics
Related links
- Cited by Google
- Similars in SciELO
- Similars in Google
Share
Ingeniería y competitividad
Print version ISSN 0123-3033On-line version ISSN 2027-8284
Abstract
ACEVEDO-CASTIBLANCO, Jorge-Alexander; SUAREZ-BARON, Marco-Javier and GONZALEZ-SANABRIA, Juan-Sebastian. Categorización e integración de columnas de opinión contenido en páginas web aplicando técnicas de Procesamiento de Lenguaje Natural. Ing. compet. [online]. 2023, vol.25, n.3, e-22313220. Epub Dec 30, 2023. ISSN 0123-3033. https://doi.org/10.25100/iyc.v25i3.13220.
Se presenta la aplicación de técnicas de Procesamiento de Lenguaje Natural para el análisis de textos, describiendo el proceso realizado desde la extracción de datos hasta la identificación y detección de opiniones de manera automática. Los textos analizados fueron columnas de opinión que reflejan los criterios de las personas sobre temas de actualidad. Lo anterior con el fin de proporcionar una manera ágil de identificar los temas de interés en la comunidad para proporcionar a los interesados de forma resumida lo que se expresa sobre estos temas. Para tal fin, se implementó un algoritmo que permite extraer información de manera precisa y limpia desde páginas web y posteriormente otro algoritmo que se encarga de efectuar la categorización automática de la información extraída, generando un resumen preciso de los principales temas en cada escrito.
Keywords : Clasificación de texto; Columnas de opinión; Procesamiento de Lenguaje Natural; Web Scrapping.