SciELO - Scientific Electronic Library Online

 
vol.37 número1Una nuevo método para la detección de valores p significativos y su aplicación a datos genéticosDiseños D-óptimos locales con heterocedasticidad: una comparación entre dos metodologías índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Revista Colombiana de Estadística

versión impresa ISSN 0120-1751

Resumen

GONZALEZ-ABRIL, LUIS; GAVILAN, JOSE M.  y  VELASCO MORENTE, FRANCISCO. Tres medidas de similitud entre conjuntos de datosunidimensionales. Rev.Colomb.Estad. [online]. 2014, vol.37, n.1, pp.79-94. ISSN 0120-1751.  https://doi.org/10.15446/rce.v37n1.44359.

Basadas en una distancia intervalar, se dan tres funciones para cuantificar similaridades entre conjuntos de datos unidimensionales mediante el uso de estadísticos de primer orden. Se usa la base de datos Glass Identification para ilustrar cómo esas medidas de similaridad se pueden usar para analizar un conjunto de datos antes de su clasificación y/o para excluir dimensiones. Además, se diseña un test de hipótesis no parámetrico para mostrar cómo similaridad, basadas en muestras aleatorias de dos poblaciones, se pueden usar para decidir si esas poblaciones son idénticas. También se realizan dos análisis comparativos con un test paramétrico y un test no paramétrico. Este nuevo test se comporta razonablemente bien en comparación con test clásicos.

Palabras clave : distancia entre intervalos; métodos del núcleo; minería de datos; tests no paramétricos.

        · resumen en Inglés     · texto en Inglés     · Inglés ( pdf )