SciELO - Scientific Electronic Library Online

 
vol.37 número1Una nuevo método para la detección de valores p significativos y su aplicación a datos genéticosDiseños D-óptimos locales con heterocedasticidad: una comparación entre dos metodologías índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Revista Colombiana de Estadística

versión impresa ISSN 0120-1751

Resumen

GONZALEZ-ABRIL, LUIS; GAVILAN, JOSE M.  y  VELASCO MORENTE, FRANCISCO. Three Similarity Measures between One-Dimensional DataSets. Rev.Colomb.Estad. [online]. 2014, vol.37, n.1, pp.79-94. ISSN 0120-1751.  https://doi.org/10.15446/rce.v37n1.44359.

Based on an interval distance, three functions are given in order to quantify similarities between one-dimensional data sets by using first-order statistics. The Glass Identification Database is used to illustrate how to analyse a data set prior to its classification and/or to exclude dimensions. Furthermore, a non-parametric hypothesis test is designed to show how these similarity measures, based on random samples from two populations, can be used to decide whether these populations are identical. Two comparative analyses are also carried out with a parametric test and a non-parametric test. This new non-parametric test performs reasonably well in comparison with classic tests.

Palabras clave : Data mining; Interval distance; Kernel methods; Non-parametric tests.

        · resumen en Español     · texto en Inglés     · Inglés ( pdf )