Revista Colombiana de Estadística

Distribución Singh-Maddala transmutada: una nueva distribución, flexible y con forma de bañera invertida para la función de riesgo

The Singh-Maddala distribution is very popular to analyze the data on income, expenditure, actuarial, environmental, and reliability related studies. To enhance its scope and application, we propose four parameters transmuted Singh-Maddala distribution, in this study. The proposed distribution is relatively more flexible than the parent distribution to model a variety of data sets. Its basic statistical properties, reliability function, and behaviors of the hazard function are derived. The hazard function showed the decreasing and an upside-down bathtub shape that is required in various survival analysis. The order statistics and generalized TL-moments with their special cases such as L-, TL-, LL-, and LH-moments are also explored. Furthermore, the maximum likelihood estimation is used to estimate the unknown parameters of the transmuted Singh-Maddala distribution. The real data sets are considered to illustrate the utility and potential of the proposed model. The results indicate that the transmuted Singh-Maddala distribution models the datasets better than its parent distribution.

La distribución Singh-Maddala es muy popular para analizar datos de ingresos, gastos, actuariales, ambientales y de confiabilidad. Para mejorar su alcance y aplicación se propone su extensión a la distribución de cuatro parámetros Singh-Maddala transmutada. Esta es más flexible en la modelación de diversos conjuntos de datos. Sus propiedades básicas, las funciones de confiabilidad y riesgos son estudiadas. La función de riesgo es decrecientes o tiene forma de bañera invertida. Como se requiere en varios estudios de sobrevivencia se exploran sus estadísticas de orden y los momentos TL, con sus casos especiales L, TL, LL y LH. Se emplea máxima verosimilitud para la estimación de los cuatro parámetros. Datos reales son usados para ilustrar la utilidad y potencialidad del modelo propuesto. Los resultados indican que la distribución propuesta ajusta mejor que la original.

Estimación de atributos sensibles usando un mecanismo de aleatorización estratificado de Kuk

This paper suggests a stratified Kuk model to estimate the proportion of sensitive attributes of a population composed by a number of strata; this is undertaken by applying stratified sampling to the adjusted Kuk model. The paper estimates sensitive parameters when the size of the stratum is known by taking proportional and optimal allocation methods into account and then extends to the case of an unknown stratum size, estimating sensitive parameters by applying stratified double sampling and checking the two allocation methods. Finally, the paper compares the efficiency of the proposed model to that of the Su, Sedory and Singh model and the adjusted Kuk model in terms of the estimator variance.

Este trabajo propone un modelo Kuk estratificado para estimar la proporción de atributos sensibles de una población compuesta por varios estratos mediante la aplicación de un muestreo estratificado al modelo Kuk ajustado. El trabajo estima parámetros sensibles en el caso en que el tamaño del estrato es conocido mediante la adopción de métodos de asignación proporcionales y óptimos, y se extiende al caso de un tamaño de estrato desconocido, estimando parámetros sensibles mediante la aplicación de un doble muestreo estratificado y la comprobación de los dos métodos de asignación. Por último, el trabajo compara la eficiencia del modelo propuesto a la del modelo de Su, Sedory y Singh y el modelo Kuk ajustado en términos de la varianza del estimador.

Modelo de regresión Bimodal

Regression analysis is a technique widely used in different areas of human knowledge, with distinct distributions for the error term. It is the case, however, that regression models with the error term following a bimodal distribution are not common in the literature, perhaps due to the lack of simple to deal with bimodal error distributions. In this paper, we propose a simple to deal with bimodal regression model with a symmetric-asymmetric distribution for the error term for which for some values of the shape parameter it can be bimodal. This new distribution contains the normal and skew-normal as special cases. A real data application reveals that the new model can be extremely useful in such situations.

El análisis de regresión es una técnica muy utilizada en diferentes áreas de conocimiento humano, con diferentes distribuciones para el término de error, sin embargo los modelos de regresión con el termino de error siguiendo una distribución bimodal no son comunes en la literatura, tal vez por la simple razón de no tratar con errores con distribución bimodal. En este trabajo proponemos un camino sencillo para hacer frente a modelos de regresión bimodal con una distribución simétrica - asimétrica para el término de error para la cual para algunos valores del parámetro de forma esta puede ser bimodal. Esta nueva distribución contiene a la distribución normal y la distribución normal asimétrica como casos especiales. Una aplicación con datos reales muestra que el nuevo modelo puede ser extremadamente útil en algunas situaciones.

Bandas de confianza para la función de supervivencia usando la ONU modelo de regresión de Weibull en presencia de censura arbitraria

Usually, the exact time at which an event occurs cannot be observed for several reasons; for instance, it is not possible to constantly monitor a characteristic of interest. This generates a phenomenon known as censoring that can be classified as having a left censor, right censor or interval censor. When one is working with survival data in the presence of arbitrary censoring, the survival time of interest is defined as the elapsed time between an initial event and the next event that is generally unknown. This problem has been widely studied in the statistic literature and some progress has been made, toward resolving and the formulation of a bivariate likelihood to estimate parameters in a parametric regression model offers positive development opportunities. In this paper, we construct a bivariate likelihood for the Weibull regression model in the presence of interval censoring. Finally, its performance is illustrated by means of a simulation study.

Usualmente, el tiempo exacto en el que ocurre un evento no se puede observar por diversas razones; por ejemplo, no es posible un monitoreo constante de las características de interés. Esto genera un fenómeno conocido como censura que puede ser de tres tipos: a izquierda, a derecha, o de intervalo. En datos de tiempo de vida con censura arbitraria (censura a izquierda, a derecha, o de intervalo), el tiempo de supervivencia de interés es definido como el lapso de tiempo entre un evento inicial y el evento siguiente, el cuál generalmente es desconocido. Este problema ha sido ampliamente estudiado en la literatura estadística, y se evidencian avances importantes. Sin embargo, la construcción de una verosimilitud bivariada para la estimación de los parámetros de modelos de regresión paramétricos, ofrece oportunidades de desarrollo. En este trabajo se construye una verosimilitud bivariada para el modelo de regresión Weibull, en presencia de censura arbitraria. Finalmente se ilustra su desempeño por medio de un estudio de simulación.

En estimación del estrés fuerza modelo en la caja P(Y_{r:n_1}< X_{k:n_2}) de distribución Lindley

The problem of estimation reliability in a multicomponent stress-strength model, when the system consists of k components have strength each component experiencing a random stress, is considered in this paper. The reliability of such a system is obtained when strength and stress variables are given by Lindley distribution. The system is regarded as alive only if at least r out of k (r< k) strength exceeds the stress. The multicomponent reliability of the system is given by Rr,k. The maximum likelihood estimator (MLE), uniformly minimum variance unbiased estimator (UMVUE) and Bayes estimator of Rr,k are obtained. A simulation study is performed to compare the different estimators of Rr,k. Real data is used as a practical application of the proposed model.

El problema de la fiabilidad de estimación en el modelo de estrés-fuerza multicomponente, cuando el sistema consta de componentes k tiene fuerza, cada componente experimentando un estrés al azar se considera en este documento. Se obtiene la fiabilidad de estos sistemas cuando las variables de fuerza y tensión están dadas por la distribución Lindley. El sistema es considerado como vivo solo si al menos r de k (r < k) fuerzas superan el estrés. La fiabilidad de varios componentes del sistema viene dado por Rr, k . El estimador de máxima verosimilitud (MLE), se obtienen estimadores insesgados de varianza uniformemente mínima (UMVUE) y el estimador de Bayes Rr, k . Se realizó un estudio de simulación para comparar los diferentes estimadores de Rr, k . Se utilizaron datos reales como aplicación práctica para el modelo propuesto.

Estimación bayesiana para la parametrización centrada de la distribución normal-asimétrica

The skew-normal (SN) distribution is a generalization of the normal distribution, where a shape parameter is added to adopt skewed forms. The SN distribution has some of the properties of a univariate normal distribution, which makes it very attractive from a practical standpoint; however, it presents some inference problems. Specifically, the maximum likelihood estimator for the shape parameter tends to infinity with a positive probability. A new Bayesian approach is proposed in this paper which allows to draw inferences on the parameters of this distribution by using improper prior distributions in the "centered parametrization" for the location and scale parameter and a Beta-type for the shape parameter. Samples from posterior distributions are obtained by using the Metropolis-Hastings algorithm. A simulation study shows that the mode of the posterior distribution appears to be a good estimator in terms of bias and mean squared error. A comparative study with similar proposals for the SN estimation problem was undertaken. Simulation results provide evidence that the proposed method is easier to implement than previous ones. Some applications and comparisons are also included.

La distribución Normal Asimétrica (SN) es una generalización de la distribución normal, incluye un parámetro extra que le permite adoptar formas asimétricas. La distribución SN tiene algunas de las propiedades de la distribución normal univariada, lo que la hace muy atractiva desde el punto de vista práctico; sin embargo presenta algunos problemas de inferencia. Particularmente, el estimador de máxima verosimilitud para el parámetro de forma tiende a infinito con probabilidad positiva. Se propone una solución Bayesiana que permite hacer inferencia sobre los parámetros de esta distribución asignando distribuciones impropias en la "parametrización centrada" para el parámetro de localidad y el de escala y una distribución tipo Beta para el parámetro de forma. Las muestras de las distribuciones posteriores se obtienen utilizando el algoritmo de Metropolis-Hastings. Un estudio de simulación muestra que la moda de la distribución posterior parece ser un buen estimador, en términos de sesgo y error cuadrado medio. Se presenta también un estudio de simulación donde se compara el procedimiento propuesto contra otros procedimientos. Los resultados de simulación proveen evidencia de que el método propuesto es más fácil de implementar que las metodologías previas. Se incluyen también algunas aplicaciones y comparaciones.

Modelos de regresión beta-binomial y binomial negativa doblemente generalizados

Overdispersion is a common phenomenon in count datasets, that can greatly affect inferences about the model. In this paper develop three joint mean and dispersion regression models in order to fit overdispersed data. These models are based on reparameterizations of the beta-binomial and negative binomial distributions. Finally, we propose a Bayesian approach to estimate the parameters of the overdispersion regression models and use it to fit a school absenteeism dataset.

La sobredispersión es un fenómeno común en conjuntos de datos de conteo, que puede afectar en alto grado las inferencias relacionadas con el modelo. En este artículo desarrollamos tres modelos de regresión conjunta de media y dispersión para ajustar datos sobredispersos. Estos modelos se basan en reparameterizaciones de las distribuciones beta-binomial y binomial negativa. Finalmente, proponemos un enfoque Bayesiano para la estimación de los parámetros de los modelos de regresión sobredispersos y lo utilizamos para ajustar un conjunto de datos de ausentismo escolar.

Propiedades estadísticas y diferentes métodosde estimación de la distribución de Rayleigh transmutada

This article addresses various properties and different methods of estimation of the unknown Transmuted Rayleigh (TR) distribution parameters from a frequentist point of view. Although our main focus is on estimation, various mathematical and statistical properties of the TR distribution (such as quantiles, moments, moment generating function, conditional moments, hazard rate, mean residual lifetime, mean past lifetime, mean deviation about mean and median, the stochastic ordering, various entropies, stress-strength parameter, and order statistics) are derived. We briefly describe different methods of estimation such as maximum likelihood, method of moments, percentile based estimation, least squares, method of maximum product of spacings, method of Cramér-von-Mises, methods of Anderson-Darling and right-tail Anderson-Darling, and compare them using extensive simulations studies. Finally, the potentiality of the model is studied using two real data sets. Bias, standard error of the estimates, and bootstrap percentile confidence intervals are obtained by bootstrap resampling.

Este artículo se aborda las varias propiedades y diferentes métodos para la estimación de los desconocidos parámetros de Transmuted Rayleigh (TR) distribución desde el punto de vista de un frequentist. Aunque la tema principal de este artículo es estimación, varias propiedades matemáticas y estadísticas de TR distribución (como cuantiles, momentos, una función que genera momentos, momentos condicionales, la tasa de peligro, la media vida residual, media vida pasada, la desviación media por media y mediana, organización stochastic, entropías varias, parámetros de tensión-fuerza y estadisticas de orden) están derivadas. Describimos brevemente los diferentes métodos de estimación, como máxima probabilidad, método de momentos, estimacién basada por percentil, mínimos cuadrados, método de máximos productos de espacios, el método de Cramér-von-Mises, los métodos de Anderson-Darling y right-tail Anderson-Darling, y compararlos con extensos estudios de simulaciones. Por último, la potencialidad del modelo está estudiando con dos conjuntos de datos reales. El margen de error, el promedio de error de las estimaciones y el percentage bootstrap de los confianza intervalos estan derivido por bootstrap remuestro.

Mixtura robusta de modelos de regresión basada en la distribución t asimétrica

In this study, we explore a robust mixture regression procedure based on the skew t distribution in order to model heavy-tailed and/or skewed errors in a mixture regression setting. We present an EM-type algorithm to compute the maximum likelihood estimators for the parameters of interest using the scale mixture representation of the skew t distribution. The performance of proposed estimators is demonstrated by a simulation study and a real data example.

En este estudio se explora una mixtura robusta de modelos de regresión basada en la distribución t asimétrica, con el propósito de modelar colas pesadas o asimétricas en los errores, en un escenario de mixtura de regresiones. Se usa un algoritmo EM para obtener los estimadores máximo verosímiles empleando una mixtura de escala de la distribución t asimétrica. El comportamiento de los estimadores propuestos se ilustra a través de une estudio de simulación y de un ejemplo con datos reales.