SciELO - Scientific Electronic Library Online

 
vol.20 número2Gestión eficiente de energía eléctrica domiciliaria con base en los incentivos de la Ley colombiana 1715 de 2014MONO+KM: administración de conocimiento en el manejo de proyectos colaborativos índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Ingeniería y Universidad

versión impresa ISSN 0123-2126

Resumen

MOGOLLON PINZON, Christian  y  ROJAS-GALEANO, Sergio. Un foro web libre de obscenidades enmascaradas utilizando alineación de secuencias. Ing. Univ. [online]. 2016, vol.20, n.2, pp.239-265. ISSN 0123-2126.  https://doi.org/10.11144/Javeriana.iyu20-2.wffd.

Por su carácter ofensivo o vulgar, las obscenidades son palabras o expresiones consideradas inapropiadas en conversaciones públicas. Hoy en día es común encontrar en blogs, foros y redes sociales el uso de obscenidades para insultar a o denigrar de opiniones, personajes o marcas; una anomalía cuyo agravante es mayor si se tiene en cuenta la amplia cobertura mundial que pueden alcanzar. El uso de diccionarios de palabras vetadas como mecanismo de filtrado es insuficiente, debido a la versatilidad del lenguaje escrito, que permite a los usuarios inventar variantes con transliteraciones o enmascaramientos del texto (por ejemplo, cambiar mierda por mlerd@ o m.i.e.r.d.a). Inspirados en la genómica comparativa, se ha desarrollado un foro web experimental (ForumForte), donde los mensajes ingresados por los usuarios son inspeccionados y depurados de obscenidades transliteradas o enmascaradas. Este artículo presenta dicho software con una descripción breve de su diseño y su uso con datos reales de comentarios provenientes de medios digitales en español y portugués. La efectividad se ubicó entre 84 % y 97 % en la escala de palabra, dependiendo de la longitud de la obscenidad (para más de cuatro letras), y en 86 % en la escala de comentario. Estos resultados insinúan la utilidad del software para filtrado de obscenidades en foros web, independientes del idioma del usuario.

Palabras clave : foros web; detección de obscenidades; análisis de texto.

        · resumen en Inglés     · texto en Inglés     · Inglés ( pdf )

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons