SciELO - Scientific Electronic Library Online

 
vol.36 número1Optimización de superficies de respuesta en curvas de crecimiento a través de análisis multivariado índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Revista Colombiana de Estadística

versión impresa ISSN 0120-1751

Rev.Colomb.Estad. vol.36 no.1 Bogotá ene./jun. 2013

 

Partial Least Squares Regression on Symmetric Positive-Definite Matrices

Regresión de mínimos cuadrados parciales sobre matrices simétricas definidas positiva

RAÚL ALBERTO PÉREZ1, GRACIELA GONZÁLEZ-FARIAS2

1Universidad Nacional de Colombia, Facultad de Ciencias, Escuela de Estadística, Medellín, Colombia. Assistant Professor. Email: raperez1@unal.edu.co
2CIMAT-México Unidad Monterrey, Departamento de Probabilidad y Estadística, Monterrey Nuevo León, México. Associate Professor. Email: gmfarias@cimat.mx


Abstract

Recientemente ha habido un aumento en el interés de analizar diferentes tipos de datos variedad-valuados, dentro de los cuáles aparecen los datos de matrices simétricas definidas positivas. En muchos estudios de análisis de imágenes médicas cerebrales, es de interés principal establecer la asociación entre un conjunto de covariables y los datos variedad-valuados que son considerados como respuesta, con el fin de caracterizar las diferencias y formas en ciertas estructuras sub-corticales.
Debido a que los datos variedad-valuados no forman un espacio vectorial, no es adecuado aplicar directamente las técnicas estadísticas clásicas, ya que ciertas operaciones sobre espacio vectoriales no están definidas en una variedad riemanniana general. En este artículo se realiza una aplicación de la metodología de regresión de mínimos cuadrados parciales, para el entorno de un número grande de covariables en un espacio euclídeo y una o varias respuestas que viven una variedad curvada llamada espacio simétrico Riemanniano. Para poder llevar a cabo la aplicación de dicha técnica se utilizan el mapa exponencial Riemanniano y el mapa log Riemanniano sobre el conjunto de matrices simétricas positivas definida, mediante los cuales se transforman los datos a un espacio vectorial en donde se pueden aplicar técnicas estadísticas clásicas. La metodología es evaluada por medio de un conjunto de datos simulados en donde se analiza el comportamiento de la técnica con respecto a la regresión por componentes principales.

Key words: multicolinealidad, regresión, teoría de matrices, variedad\linebreak Riemanniana.


Resumen

Recently there has been an increased interest in the analysis of different types of manifold-valued data, which include data from symmetric positive-definite matrices. In many studies of medical cerebral image analysis, a major concern is establishing the association among a set of covariates and the manifold-valued data, which are considered as responses for characterizing the shapes of certain subcortical structures and the differences between them.
The manifold-valued data do not form a vector space, and thus, it is not adequate to apply classical statistical techniques directly, as certain operations on vector spaces are not defined in a general Riemannian manifold. In this article, an application of the partial least squares regression methodology is performed for a setting with a large number of covariates in a euclidean space and one or more responses in a curved manifold, called a Riemannian symmetric space. To apply such a technique, the Riemannian exponential map and the Riemannian logarithmic map are used on a set of symmetric positive-definite matrices, by which the data are transformed into a vector space, where classic statistical techniques can be applied. The methodology is evaluated using a set of simulated data, and the behavior of the technique is analyzed with respect to the principal component regression.

Palabras clave: Matrix theory, Multicollinearity, Regression, Riemann\linebreak manifold.


Texto completo disponible en PDF


References

1. Arsigny, V., Fillard, P., Pennec, X. & Ayache, N. (2006), 'Log-euclidean metrics for fast and simple calculus on diffusion tensors', Magnetic Resonance in Medicine, 56, 411-421.         [ Links ]

2. Barmpoutis, A., Vemuri, B. C., Shepherd, T. M. & Forder, J. R. (2007), 'Tensor splines for interpolation and approximation of DT-MRI with applications to segmentation of isolated rat hippocampi', IEEE Transations on Medical Imaging, 26, 1537-1546.         [ Links ]

3. Batchelor, P., Moakher, M., Atkinson, D., Calamante, F. & Connelly, A. (2005), 'A rigorous framework for diffusion tensor calculus', Magnetic Resonance in Medicine, 53, 221-225.         [ Links ]

4. Fingelkurts, A. A. & Kahkonen, S. (2005), 'Functional connectivity in the brain - is it an elusive concepts?', Neuroscience and Biobehavioral Reviews, 28, 827-836.         [ Links ]

5. Fletcher, P. T. & Joshi, S. (2007), 'Riemannian geometry for the statistical analysis of diffusion tensor data', Signal Processing, 87, 250-262.         [ Links ]

6. Grenander, U. & Miller, M. I. (1998), 'Computational anatomy: An emerging discipline', Quarterly of Applied Mathematics, 56, 617-694.         [ Links ]

7. Lepore, N., Brun, C. A., Chou, Y., Chiang, M., Dutton, R. A., Hayashi, K. M., Luders, E., Lopez, O. L., Aizenstein, H. J., Toga, A. W., Becker, J. T. & Thompson, P. M. (2008), 'Generalized tensor-based morphometry of HIV/AIDS using multivariate statistics on deformation tensors', IEEE Transactions in Medical Imaging 27, 129-141.         [ Links ]

8. Li, Y., Zhu, H., Chen, Y., Ibrahim, J. G., An, H., Lin, W., Hall, C. & Shen, D. (2009), RADTI: regression analysis of diffusion tensor images, 'Progress in Biomedical Optics and Imaging - Proceedings of SPIE', Vol. 7258.         [ Links ]

9. Massy, W. F. (1965), 'Principal components regression in exploratory statistical research', Journal of the American Statistical Association 64, 234-246.         [ Links ]

10. Pennec, X., Fillard, P. & Ayache, N. (2006), 'A Riemannian framework for tensor computing', International Journal of Computer Vision 66, 41-66.         [ Links ]

11. Schwartzman, A. (2006), Random ellipsoids and false discovery rates: Statistics for diffusion tensor imaging data, PhD thesis, Stanford University.         [ Links ]

12. Wold, H. (1975), 'Soft modeling by latent variables; the non-linear iterative partial least squares approach', Perspectives in Probability and Statistics,, 1-2.         [ Links ]

13. Wold, S., Albano, C., Dunn, W. I., Edlund, U., Esbensen, K., Geladi, P., Hellberg, S., Johansson, E., Lindberg, W. & Sjöström, M. (1984), Multivariate data analysis in chemistry, 'Chemometrics', Vol. 138 of NATO ASI Series, Springer Netherlands, p. 17-95.         [ Links ]

14. Yuan, Y., Zhu, H., Lin, W. & Marron, J. S. (2012), 'Local polynomial regression for symmetric positive-definite matrices', Journal of the Royal Statistical Society: Series B (Statistical Methodology) 74(4), 697-719.         [ Links ]

15. Zhu, H. T., Chen, Y. S., Ibrahim, J. G., Li, Y. M. & Lin, W. L. (2009), 'Intrinsic regression models for positive-definite matrices with applications to diffusion tensor imaging', Journal of the American Statistical Association 104, 1203-1212.         [ Links ]


[Recibido en junio de 2012. Aceptado en mayo de 2013]

Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:

@ARTICLE{RCEv36n1a10,
    AUTHOR  = {Pérez, Raúl Alberto and González-Farias, Graciela},
    TITLE   = {{Partial Least Squares Regression on Symmetric Positive-Definite Matrices}},
    JOURNAL = {Revista Colombiana de Estadística},
    YEAR    = {2013},
    volume  = {36},
    number  = {1},
    pages   = {177-192}
}