SciELO - Scientific Electronic Library Online

 
vol.35 número3Pruebas de bondad de ajuste para la distribución Gumbel con datos censurados por la derecha tipo IIUso de muestras de rango ordenado en una prueba de ajuste basada en entropía para la distribución Laplace índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Revista Colombiana de Estadística

versión impresa ISSN 0120-1751

Resumen

GUERRERO, FABIO G.. Sobre la entropía del español escrito. Rev.Colomb.Estad. [online]. 2012, vol.35, n.3, pp.425-442. ISSN 0120-1751.

Se presenta una discusión sobre la entropía de la lengua española por medio de un método práctico para el cálculo de la entropía de un texto mediante procesamiento informático directo. Como un ejemplo de aplicación, se analizan treinta muestras de texto español, sumando un total de 22,8 millones de caracteres. Longitudes de símbolos desde n = 1 hasta 500 fueron consideradas tanto para palabras como caracteres. Para el cálculo de la distribución de probabilidad de los símbolos se emplearon procesamiento directo por computador y la ley de probabilidad de los grandes números. Se presenta una relación empírica de la entropía con la longitud del texto (en caracteres) y el número de palabras diferentes en el texto. Se analizan también propiedades estadísticas de la lengua española cuando se considera como producida por una fuente estocástica, tales como la invarianza al desplazamiento del origen, ergodicidad y la propiedad de equipartición asintótica.

Palabras clave : entropía de Shannon; ley de grandes números; ley de Zipf; procesos estocásticos.

        · resumen en Inglés     · texto en Inglés     · Inglés ( pdf )