Scielo RSS <![CDATA[Revista Colombiana de Estadística]]> http://www.scielo.org.co/rss.php?pid=0120-175120070001&lang=pt vol. 30 num. 1 lang. pt <![CDATA[SciELO Logo]]> http://www.scielo.org.co/img/en/fbpelogp.gif http://www.scielo.org.co <![CDATA[Implementation of Statistics in Business and Industry]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100001&lng=pt&nrm=iso&tlng=pt Statisticians have devised many tools for application and these are available to be utilized for general business improvement and industrial problem solving. However, there is a wide gap between the available tools and what are practiced in business and industrial organizations. Thus it is important for statisticians to direct serious attention to bridging this gap if statistics is to be relevant in business and industry and to the society at large. In this paper we look at some ideas for implementation of statistical methods in business and industry.<hr/>Los estadísticos han desarrollado muchas herramientas para su aplicación en problemas prácticos. Estas herramientas están disponibles para ser utilizadas en el mejoramiento de los negocios en general y para solucionar problemas industriales. Sin embargo, existe una brecha entre las herramientas disponibles y las que utilizan las organizaciones industriales y de negocios. Por tanto, es importante que los estadísticos dirijan su atención a disminuir esta brecha si se quiere que la estadística sea relevante en los negocios, la industria y en general en la sociedad. En este artículo se presentan algunas ideas para la aplicación apropiada de métodos estadísticos en los negocios y la industria. <![CDATA[<b> About the Best Linear Unbiased Predictor (BLUP) and Associated Restrictions </b>]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100002&lng=pt&nrm=iso&tlng=pt A través del modelo lineal clásico de Gauss-Markov, se caracteriza el modelo de efectos mixtos, se aplica la técnica de multiplicadores de Lagrange para obtener los mejores predictores lineales (BLUP) y se ilustran los resultados de Searle (1997), donde se encuentra que las sumas de los BLUP, cuando se evalúan sobre los efectos aleatorios (exceptuando las interacciones provenientes únicamente de efectos aleatorios), son iguales a cero, encontrándose con esto una analogía entre la reparametrización F-restricción que se hace sobre los modelos de efectos fijos y la forma general de la restricción que se hace sobre los modelos de efectos mixtos. Se lleva a cabo una ilustración en modelos cruzados con los resultados expuestos en Gaona (2000), donde se evaluó la ganancia de peso en novillos de ganado criollo sanmartiniano; adicionalmente para modelos jerárquicos se ilustra con los resultados presentados en Harville & Fenech (1985), correspondientes a mediciones de las ganancias en peso de un grupo de ovejos machos. Se observa de los resultados que en el modelo usual de análisis de varianza para modelos mixtos, ciertas sumas de los predictores lineales insesgados (BLUP), asociados a los efectos aleatorios, son iguales a cero si se tiene un modelo con una sola variable respuesta. Sin embargo, esta propiedad se pierde cuando se tienen evaluaciones diferentes en la misma unidad experimental, las cuales van a estar correlacionadas. Un caso diferente resulta en estudios longitudinales como se muestra empíricamente en la sección 5.3.<hr/>The mixed linear model is characterized using the classic linear model of Gauss-Markov. The multipliers of Lagrange are a tool to obtain the best lineal predictors (BLUP), we shown the results of Searle (1997), where some sums of the best linear unbiased predictors of random effects are zero. This characteristic is similar with the reparametrization F-restriction in the fixed linear models. We present an illustration based on results of Gaona (2000) in crossed classification with the data measured in young bulls sanmartiniano, and other example in hierarchical models with the results presented in Harville & Fenech (1985) corresponding to mensurations of weight of a group of male sheep. In the usual model of analysis of variance for mixed models, some sums of the unbiased lineal predictors (BLUP) associated to random effects are zero when the model has a single variable answer, however, this property does not work in cases in which there are different evaluations in the same experimental unit, which will be correlated. <![CDATA[An Introduction to Optimal Designs]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100003&lng=pt&nrm=iso&tlng=pt Introducimos varios conceptos utilizados en la teoría de diseños de experimentos óptimos. Definimos criterios de optimalidad utilizados en esta área y exploramos sus propiedades. Se listan algunos resultados importantes para encontrar diseños óptimos para modelos lineales y no lineales, entre ellos teoremas de equivalencia. Finalmente se presentan algunos ejemplos típicos donde se aplica la teoría vista anteriormente.<hr/>We introduce several concepts used in optimal experimental design. Optimality criteria used in this area are defined and their properties are explored. Some important results for finding optimal designs in linear and nonlinear models are listed, specially equivalence theorems are formulated. Finally, we present some examples where that theory is applied. <![CDATA[Calculus of the Estimators of Linear Quantile Regression by the Method ACCPM]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100004&lng=pt&nrm=iso&tlng=pt Se muestra cómo calcular los estimadores en regresión cuantílica por medio del método de optimización no diferenciable ACCPM (Analytic Center Cutting Plane Method). El cálculo de dichos estimadores usualmente se encuentra por medio de programación lineal y sus respectivas técnicas de solución (método simplex, métodos de punto interior, etc.). La primera parte presenta las generalidades de la regresión cuantílica y su formulación como un problema de programación lineal. Además, se realiza una breve descripción del método ACCPM. Por último, se muestra la aplicación del método ACCPM para el cálculo de estimadores por cuantiles y los resultados numéricos y comparaciones del método ACCPM con el paquete estadístico R y el paquete de optimización GAMS.<hr/>The present work shows how to calculate the estimators in quantile regression by nondifferentiable optimization method ACCPM (Analytic Center Cutting Plane Method). The calculus of the estimators is usually found by linear programming and its respective techniques of solution (Simplex method, interior point methods, etc.). The first part presents some generalities of quantile regression and its formulation as a linear programming problem. Also, a brief description of the ACCPM method is made. Finally, it is shown the application of the ACCPM method for the calculation of the estimators by quantiles and the numerical results and comparisons of the ACCPM with the statistic package R and the optimization package GAMS. <![CDATA[Interval Estimation for the Poisson Distribution Parameter with a Single Observation]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100005&lng=pt&nrm=iso&tlng=pt La estimación del parámetro de la distribución de Poisson, digamos λ, es un problema importante en el trabajo estadístico aplicado. En muchas ocasiones solo disponemos de un único dato para construir un intervalo de confianza. Se muestra cuándo se pueden construir intervalos de confianza basados en el teorema central del límite, el método exacto y la razón de verosimilitud cuando se tiene una sola observación. Se ilustra este caso construyendo un intervalo para la tasa de suicidios en Colombia.<hr/>The estimation of the parameter of the Poisson distribution, say λ, is an important task in applied statistics. Frequently we only have available a single observation and our goal is to construct a confidence interval. We illustrate under what conditions we can construct a confidence interval based on three methods: central limit theorem, exact method, and the likelihood ratio method. We also illustrate this problem constructing a confidence interval for the rate of suicides in Colombia. <![CDATA[Subspace-Based Methods to Determine Unit Roots and Cointegrating Ranks]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100006&lng=pt&nrm=iso&tlng=pt Proponemos un nuevo procedimiento para detectar raíces unitarias basado en métodos de subespacios. Su planteamiento comporta tres aspectos fundamentales. Primero, la misma metodología se puede aplicar a series individuales o a vectores de series temporales. Segundo, utiliza una familia flexible de criterios de información, cuyas funciones de pérdida se pueden adaptar a las propiedades estadísticas de los datos. Finalmente, no requiere especificar un proceso estocástico para las series analizadas. Se demuestra la consistencia del método y los ejercicios de simulación revelan buenas propiedades en muestras finitas. Además, su aplicación práctica se ilustra mediante el análisis de varias series reales.<hr/>We propose a new procedure to detect unit roots based on subspace methods. It has three main original aspects. First, the same method can be applied to single or multiple time series. Second, it uses a flexible family of information criteria, which loss functions can be adapted to the statistical properties of the data. Last, it does not require the specification of a stochastic process for the series analyzed. This procedure is consistent and a simulation exercise shows that it has good finite sample properties. Its application is illustrated with the analysis of several real time series <![CDATA[Survival Analysis Applied to Commercial Bank in Venezuela between 1996 and 2004]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100007&lng=pt&nrm=iso&tlng=pt Se utiliza el análisis de supervivencia como técnica estadística para investigar cuándo es probable que una entidad financiera cambie de estado. La variable aleatoria de interés es el lapso de tiempo que tarda la entidad en cambiar de estado. Específicamente, interesa el tiempo en ocurrir el cambio de estado y cuáles son las variables que más influyen en el cumplimiento del cambio de estado. Se lleva a cabo un análisis de supervivencia clásico, una estimación por el método de Kaplan y Meier y un ajuste a través del modelo de Cox, utilizando los datos de la banca comercial venezolana entre 1996 y 2004. La fusión bancaria es el evento de interés para el cambio de estado. Se logra identificar cuatro razones de riesgo que son consistentes con la revisión teórica de los modelos de alerta temprana.<hr/>In this work, survival analysis is used as a statistical technique to find out when any bank probably changes of state. The random variable to study is the observed time period of the lifetime where there is a change of state. Special interest is focused in knowing the occurrence of changes of states, and in identifying the variables that could affect the changes of states. This work deals with a classical survival analysis by the Kaplan-Meier estimation and the fitting of the Cox model, using commercial Venezuelan banks during the 1996-2004 period. Merge banking occurrence is the main event to identify a change of state. This work allowed identifying four financial indicators that kept similar correspondence with those obtained from other early warning models. <![CDATA[Exploratory Analysis of Regionalized Variables with Functional Methods]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100008&lng=pt&nrm=iso&tlng=pt Se muestra cómo las estadísticas descriptivas funcionales y el análisis en componentes principales funcional (ACPF) pueden emplearse en la evaluación empírica del supuesto de estacionariedad considerado en la modelación de variables regionalizadas. Se toma como ejemplo información georreferenciada correspondiente a mediciones de profundidad recogidas en 114 sitios de la Ciénaga Grande de Santa Marta, Colombia.<hr/>It is shown how summary statistics of functional data and functional principal components analysis (FPCA) can be used to evaluate the stationarity assumption considered in modeling of regionalized variables. As an example is taken georeferenced information of depth measured at 114 locations at Ciénaga Grande de Santa Marta, Colombia. <![CDATA[Modelo aditivo de Aalen: uma aplicação para dados de sinusite em pacientes com Aids]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100009&lng=pt&nrm=iso&tlng=pt Em estudos de sobrevivência, as vezes, o interesse não é apenas na distribuição do tempo de falha. &EACUTE; comum a comparação de tempos de sobrevivência de dois ou mais grupos bem como a verificação do efeito de covariáveis na resposta tanto em engenharia quanto, principalmente, em situações clínicas. A maneira mais eficiente de incorporar o efeito desses fatores no estudo é utilizar um modelo estatístico de regressão. Freqüentemente em estudos de sobrevivência o efeito das covariáveis de interesse pode variar ao longo do tempo de duração do estudo. Estas covariáveis são denominadas de dependentes do tempo e a inclusão delas na análise pode fornecer resultados mais precisos. Aalen propôs um modelo de risco aditivo que apresenta vantagens práticas quando as covariáveis são acompanhadas ao longo do tempo e os seus valores podem ser modificados durante o estudo. A principal vantagem desse modelo é que através de análise gráfica é possível verificar mudanças no tempo na influência de cada uma das covariáveis. Isto é, análises com este modelo fornecem informações detalhadas a respeito da influência temporal de cada covariável. Dessa forma o modelo aditivo de Aalen é apresentado neste trabalho com o objetivo de mostrar a sua importância na presença de covariáveis dependentes do tempo. Um banco de dados real envolvendo pacientes infectados pelo HIV e o tempo até o desenvolvimento de sinusite é utilizado para ilustrar o ajuste deste modelo.<hr/>In survival analysis sometimes the interest is not just on the failure time distribution function. It is common treatment comparisons as well as studying the effect of covariates in the response. This fact happens in engineering and clinical studies. Covariates effects are usually incorporated in the analysis by using a regression model. Moreover, in some real situations, covariates may be monitored and measured along the follow-up period. These covariates are known as time-dependent covariates. Analysis that include these covariates can be more reliable. Aalen proposed an additive risk model that is very attractive. This model has showed some practical advantages especially when the covariates effects varies in time. The main advantage of this model it is that through graphical analysis it is possible to verify changes in the time in the influence of each one of the covariates. That is, analyses with this model supply information detailed regarding the secular influence of each covariate. This model is presented in this paper in terms of time-dependent covariates. A real data set related to HIV patients and time to develop sinusitis is used to illustrate the fit of the additive Aalen model. <![CDATA[Forecast Evaluation of the Exchange Rate Using Artificial Neural Networks and Asymmetric Cost Functions]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512007000100010&lng=pt&nrm=iso&tlng=pt Se comparan especificaciones lineales y no lineales (estas últimas expresadas en redes neuronales artificiales) ajustadas a la variación porcentual diaria del tipo de cambio utilizando para ello funciones de costo tradicionales (simétricas) y funciones de pérdida asimétricas. Los resultados muestran que las redes neuronales permiten obtener mejores pronósticos con ambos tipos de funciones de costos. Sin embargo, es de anotar que cuando se evalúan los pronósticos con funciones asimétricas, el modelo no lineal supera ampliamente a su contraparte lineal.<hr/>We compare forecasts obtained via linear vs. non linear specifications. The models are adjusted to the daily percentage change of the exchange rate and the comparison is done using both symmetric and asymmetric cost functions. Results show that the non linear model (which here takes the form of an Artificial Neural Network –ANN) performs better in terms of forecasting ability when evaluated with both types of cost functions. Further more, when using asymmetric costs, the ANN is a much better predictor than its linear counterpart.