SciELO - Scientific Electronic Library Online

 
vol.15 issue1CHALLENGES IN THE REAL ESTATE INDUSTRY LA SERENA-CHILE: KEY VARIABLES OF EMOTIONAL LINKHEALTH INNOVATION: A REVIEW OF THE SCIENTIFIC LITERATURE FROM THE PAST DECADE author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Dimensión Empresarial

Print version ISSN 1692-8563

Dimens.empres. vol.15 no.1 Barranquilla Jan./June 2017

https://doi.org/10.15665/rde.v15i1.547 

Artículos

MODELO LINEAL DINÁMICO BAYESIANO COMO PROCEDIMIENTO DE ACTUALIZACIÓN AUTOMÁTICA PARA MODELOS ESTADÍSTICOS PREDICTIVOS*

BAYESIAN DYNAMIC LINEAR MODEL AS AN AUTOMATIC UPDATE PROCEDURE FOR PREDICTIVE STATISTICAL MODELS

MODELO DINÂMICO LINEAR BAYESIANO COMO UM PROCEDIMENTO DE ACTUALIZAÇÃO AUTOMÁTICA PARA MODELOS ESTATÍSTICOS PREDITIVOS

Antonio José Boada1 

1Master en Finanzas, docente investigador en Universidad Simón Bolívar, www.usb.ve , Sede Litoral, Departamento Formación General y Ciencias Básicas, Valle Camurí Grande, Estado Vargas, Venezuela. Correo: antonioboada@usb.ve y antonio_boada@virtual.ceipa.edu.co.


RESUMEN

Mediante este artículo, se expone una aplicación práctica, comprobada a través de datos reales, de cómo el Modelo Lineal Dinámico Bayesiano de Orden 1, puede ser aplicado directamente sobre los residuos aleatorios provenientes de un Modelo Clásico de Regresión Múltiple Estático, generando así un complemento interesante para los modelos estadísticos predictivos. Este componente bayesiano, genera un factor que se retro alimenta de los residuos (diferencia entre las predicciones y los valores históricos reales), ajustándose según la información histórica más reciente, todo ellos de forma automatizada y sin necesidad de ajustar continuamente los coeficientes de Regresión Múltiple, lo que genera un incremento en la robustez y estabilidad de dichos modelos para herramientas automatizadas de predicción en empresas. Este artículo establece un caso de cómo la estadística bayesiana puede ser un excelente complemento para las técnicas de la estadística clásica frecuentista.

Palabras Clave: Modelo Bayesiano; Análisis de Residuos; Predicción Bayesiana; Estimación Automatizada

ABSTRACT

This paper, a practical application, proven through actual data, how the Bayesian Dynamic Linear Model Order 1 can be applied directly to the random waste from a multiple regression model Classic Static, thus creating an interesting addition is exposed for predictive statistical models. This Bayesian component generates a retro factor that feeds on waste (difference between predictions and actual historical values), adjusted according to the most recent historical information, all of them automatically and without the need to continually adjusts the Multiple Regression coefficients, generating an increase in the strength and stability of such models for prediction automated tools companies. This article provides a case of how Bayesian statistics can be an excellent complement to the techniques of classical frequentist statistics.

Keywords: Bayesian Model; Waste Analysis; Bayesian prediction; Automated Estimation

RESUMO

Através deste artigo, uma aplicação prática, comprovada através de dados reais, como o modelo linear dinâmico Bayesian Ordem 1 pode ser aplicado diretamente sobre os resíduos aleatória de um modelo clássico de regressão múltipla estático, gerando assim um suplemento exposta interessante para os modelos estatísticos preditivos. Este componente Bayesian gera um fator que retro alimenta de resíduos (diferença entre as previsões e os valores históricos reais), ajustado de acordo com as últimas informações históricas, todas elas automaticamente e sem a necessidade de ajustar continuamente os coeficientes de regressão múltipla , gerando um aumento na força e estabilidade de tais modelos para ferramentas de previsão automatizada empresas. Este artigo fornece um exemplo de como as estatísticas Bayesian pode ser um excelente complemento para as técnicas de estatística freqüentista clássicos.

Palavras chave: Modelo Bayesian; Análise de Resíduos; Previsão Bayesian; Estimativa Automatizado

INTRODUCCIÓN

En virtud de la modernización de los mercados, los directivos usualmente requieren más información referente al comportamiento de los productos y las ofertas aplicadas; así como una optimización en la efectividad de la valoración del impacto en la demanda según los diferentes instrumentos mercadotécnicos utilizados.

Los pronósticos son vitales para toda organización mercantil y para toda decisión administrativa importante. Los pronósticos presentan la base de los planes a largo plazo de la empresa. En las áreas funcionales de finanzas y contabilidad, los pronósticos son la base para la planeación del presupuesto y el control de los costos (Klepacki, 2005). El departamento de marketing depende de los pronósticos de ventas para sus planes de productos nuevos, para remunerar al personal de ventas y para tomar otras decisiones fundamentales. El personal de producción y el de operaciones usan los pronósticos para tomar decisiones de manera periódica, respecto a la selección de procesos, la planeación de la capacidad y la disposición física de las instalaciones, así como para las decisiones rutinarias sobre los planes de producción, los programas y los inventarios (Chase, Jacobs, & Aquilano, 2005).

Este artículo incluye una valoración con datos reales, realizada en una empresa con estilo de venta directa, donde su canal de distribución puede verse reflejado de la siguiente manera: Productor (Empresa) - Minorista (Promotores) - Consumidor

Este tipo de empresas manifiesta un esquema sencillo y controlado de ventas y distribución, a través de vendedoras, representantes o consejeras. La notoria ausencia de mayoristas presenta una ventaja al momento de realidad predicción, ya que es posible modelarlas y estimarlas mediante un modelo estadístico de regresión múltiple, donde las variables causales corresponden a una cuantificación de las variables mercadotécnicas; incluyendo la duración para dichas estrategias mercadológicas.

Mediante este procedimiento de modelaje fue posible crear un procedimiento general estadístico, expandible a todo el portafolio de productos de la compañía; esto de manera de lograr predicciones y simulaciones de escenarios con alto grado de confianza sobre su posible evolución; objetivo este, de gran importancia en todo proceso de planificación y diseño de políticas gerenciales.

Para estas empresas con estilo de ventas directa (por catálogo), es factible determinar y cuantificar los impactos generados por variables de mercadotecnia. Sin embargo, los modelajes de estos impactos generan modelos estadísticos multivariantes estáticos, alimentado de las variables independientes que originan influencia significativa sobre la variable dependiente de interés (demanda de productos). Ahora bien, estos modelajes presentan igualmente limitaciones a nivel de los residuos, específicamente a nivel de autocorrelación y ajuste ante comportamiento futuros de demanda (situación que siempre ocurrirá en los modelos estadísticos multivariantes estáticos).

Las previsiones de ventas se refieren a un negocio en particular. Un pronóstico de la demanda de los productos reales de la empresa ayudará a planificar el pedido o la fabricación. También permite la coordinación de los esfuerzos de marketing para que los clientes sepan que el negocio está en condiciones de satisfacer la demanda (Malhotra, 1997). Además, las previsiones de ventas precisas pueden ayudar a un plan de la compañía para los gastos en efectivo y los ingresos. Sin estas previsiones, una empresa puede tratar constantemente de ponerse al día con picos de ventas y valles. Las previsiones de ventas permiten esta preparación.

La importancia de este artículo radica en desarrollar un sistema de estimación, creado con la intención de predecir la demanda de los productos, con consistencia, robustez y estabilidad de residuos, así como también, adaptación automática según el comportamiento de la demanda en el tiempo; esto segmentado por el número de referencia a nivel de inventario, o también denominado SKU (Stock Keeping Unit).

IMPORTANCIA DE LAS PREDICCIONES DE DEMANDA

Un negocio debe ajustarse constantemente a los cambios del mercado. Para hacer estos ajustes, la gerencia necesita predecir lo que sucederá en este escenario. La precisión al hacer predicciones puede significar la diferencia entre estar preparado y no estarlo.

Para Schiffman (2010), cada empresa maneja una estructura a nivel de canal de marketing, que describe la composición y los vínculos de sus integrantes. El diferente número de vías de distribución deseado por los consumidores, y que pueden diseñar las organizaciones, es considerablemente grande. Sin embargo, en cualquier canal las diversas etapas se componen de comerciantes (incluso productores) y los agentes, que tienen la responsabilidad de manejar el producto a través del canal. Un mercado consta de las personas que compran o que podrían comprar un producto (Kotler y Armstrong, 1994).

Las previsiones del mercado van más allá de un negocio en particular, para examinar el mercado en general. Entenderlo es esencial, porque la expansión del mercado y la disminución pueden dar lugar a una revisión de las expectativas. En lugar de tratar de frustrar el mercado, ajustando la mira de acuerdo a las previsiones del mismo, se puede prevenir en función al inventario (Boada, 2011).

A través de un modelo estadístico híbrido, generado por tres componentes fundamentales, es posible desarrollar un modelo estadístico predictivo que tenga consistencia y estabilidad en el tiempo, con la factibilidad de ajustar sus niveles de predicciones, mientras potencia su aprendizaje entre predicción e historia.

TIPOS DE DEMANDA

Levin (1996) revela la siguiente clasificación referente a la terminología manejada por la demanda de productos que se manejará en este artículo:

Demanda Irregular: La demanda varía de acuerdo con las temporadas, los días o incluso las horas, ocasionando problemas de capacidad inactiva o saturada.

Demanda saturada: Ocurre cuando la demanda es superior a la que la compañía desea o puede manejar. Este término también es conocido como demanda no satisfecha.

Demanda plena: La organización tiene exactamente la cantidad de demanda que el mercado requiere y puede manejar. También conocido como venta real.

En este sentido, el modelo predictivo que se manejará en este artículo se fundamentará en una única variable dependiente denominada DEMANDA, la cual será identificada como la necesidad real del mercado a nivel de solicitud del producto.

Demanda = Demanda Plena + Demanda Saturada

O

DEMANDA = VENTA + DEMANDA NO SATISFECHA

Las predicciones manejadas por dicho modelo, se fundamentará en función a la familia o tipo de Producto, siendo éstos los artículos finalmente manufacturados.

MEDICIÓN Y PRONÓSTICO DE LA DEMANDA

El crecimiento futuro del mercado también es importante; en este sentido, las empresas desean incursionar en mercados que ofrezcan la posibilidad de un crecimiento importante. El potencial puede depender de la tasa de crecimiento del target usuario de ese producto, según edad, ingresos, género, entre otros factores.

Pronosticar las consecuencias de estas fuerzas del entorno en la demanda final de productos, es una situación compleja, incrementada por aspectos inherente al país, cuando se trata de países con economías emergentes.

Los pronósticos equivocados pueden desembocar en inventarios excesivamente grandes, en precios subestimados que resultan muy costosos o, incluso, en la pérdida de ventas debido a la falta de disponibilidad en existencia (Chase, 2005).

Generalmente, toda empresa utiliza una serie de instrumentos tácticos y controlables, con la intención de influir en la demanda de su producto. En este sentido, las posibilidades existentes se pueden reunir en cuatro grupos de variables: Producto, Precio, Posición y Promoción.

  • El producto: es la combinación de “bienes y servicios” que la empresa ofrece al mercado meta.

  • El Precio: es la cantidad de dinero que los clientes pagarán para obtener el producto.

  • La Posición: se refiere a las actividades que la compañía realiza para colocar el producto a disposición de los consumidores meta. En el caso particular de las empresas con estilo de venta directa, la posición se encuentra caracterizada por las representantes o consejeras que se dirigen a los hogares u oficinas de los compradores (puerta a puerta).

  • La Promoción: son aquellas actividades que comunican los méritos y que convencen a los clientes para comprarlos. En las empresas con estilo de venta directa, esta variable estará determinada por la ubicación del producto dentro del catálogo de ventas (Exposición) y por la oferta que presente este artículo en ese catálogo particular (Promoción).

La consistencia de las estimaciones y predicciones de escenarios es fundamental para mantener los análisis previos de escenarios, en función a la planificación de estrategias creativas, producidas por el área de marketing.

Mediante este artículo, se prevé adicional al desarrollo de un modelo estadístico de regresión múltiple; un sistema estadístico complementario, que puede ser ajustable a cualquier modelo de predicción, ya que ejecuta directamente sobre los residuos, creando un componente de ajuste según la evolución de la variable demanda en el tiempo.

MODELO UTILIZADO

Para este artículo, de procedió a modelar estadísticamente el comportamiento de la demanda de productos en una frecuencia de tiempo constante, según cada catálogo de ventas, mediante un modelo de regresión múltiple, tomando en cuenta variables de mercadotecnia especializados para empresas con estilo de venta directa. Dicho modelo posee adicionalmente un complemento estacional valorado según las frecuencias de tiempo constante.

Finalmente, debido a la rigidez del modelo estadístico multivariado a nivel de ajuste de la demanda según la evolución del mercado en el tiempo, se procedió a añadir un complemento en los residuos del modelo, utilizando un modelo lineal dinámico bayesiano de orden 1, a fin de lograr la actualización automática de las estimaciones según la evolución del comportamiento de la demanda en tiempo individualizado para cada producto.

En este sentido, el modelo finalmente utilizado para predecir la demanda de productos, individualizado por SKU contiene la siguiente estructura:

Es importante determinar si los parámetros son significativos, en especial la pendiente 𝛽̂, ya que es el que determina si la relación lineal entre ambas variables es estadísticamente significativa (Montgomery, Peck, & Vinning, 2006).

En donde el comportamiento exponencial de la demanda se ve suavizado mediante la transformación de la variable dependiente, para poder aplicar un Modelo Exponencial de la Demanda.

Luego, el componente del modelo predictivo viene determinado por tres (3) etapas:

  • MRM (X1, X2, .., Xn): Corresponde a un Modelo de Regresión Múltiple, fundamentado en las variables mercadotécnicas (X1, X2, .., Xn): calculadas mediante el comportamiento histórico de la evolución de la demanda. Para efectuar el cálculo de los Variables mercadotécnicas se utilizaron números índice de proporción, y su forma de cálculo fue a través de la técnica s de Mínimos Cuadrados Ordinarios.

  • MLDB: Corresponde al Modelo Lineal Dinámico Bayesiano de Orden 1, utilizado como complemento de ajuste en los residuos, a fin de evaluar continuamente la disparidad existente entre el valor predicho (Predicción de la Demanda) y el valor real (Demanda Real), y así generar un componente de ajuste que evoluciona según el comportamiento de la demanda de cada producto en el tiempo.

  • Modelo Estadístico Final (MF). Que corresponde a la unificación aditiva de los dos modelos estadísticos anteriormente descritos.

Modelo de regresión múltiple (MRM). Columna vertebral para predicción de productos en empresas con estilo de venta directa

Es la primera parte del modelo de predicción, en donde se fundamenta en la información histórica detallada de la familia de productos; generada en base a las variables de mercadotecnia manejadas en la corporación en estudio (Boada, 2013).

En este sentido, fue factible el manejo y uso de productos con historial relevante, desglosados por códigos de producción y almacenamiento, SKU. Sin embargo, a pesar de tener la información individualizada por producto, es necesario analizar y agrupar en productos de uso similar, precisamente con la intención de crear modelos genéricos que permitan posteriormente su automatización en una herramienta computarizada.

En función a las variables de mercado manejadas y controladas en las empresas con estilo de venta por catálogo, es posible generar variables causales de asociación, que permitan conformar un modelo de regresión que valore estos efectos.

El análisis de regresión es un procedimiento poderoso y flexible, utilizado principalmente para analizar las relaciones de asociación entre una variable dependiente métrica y una o más variables independientes o con multicolinealidad reducida (Boada, 2011).

Este modelo de regresión múltiple (MRM) representa la parte inicial, y la columna vertebral del modelo estadístico predictivo, desarrollado para estimar la demanda de productos por cada catálogo de ventas en una empresa con estilo de venta directa. En este sentido, el estudio y desarrollo es posible, ya que estas empresas poseen variables que controlan y manejan según las ofertas de promoción, exposición en el catálogo, número de vendedores, entre otros.

De esta manera, es posible valorar cuantitativamente el impacto que proporciona, la variación de cada variable de mercado en la demanda del número de artículos, para cada producto en particular (SKU).

Agrupación de productos según familias

Para el desarrollo de estos modelos estadísticos predictivos, en su sección de modelo de regresión múltiple (MRM), se procedió a agrupar productos según características físicas similares, logrando encontrar que esta forma de agrupación mantiene niveles de consistencia y homogeneidad adecuados según la variabilidad de la Demanda por SKU.

Variables de mercadotecnia utilizadas en la realización del modelo de regresión múltiple (MRM).

Durante el análisis y selección de las variables de mercado se utilizaron variables cualitativas y cuantitativas y que pueden ser controladas y manejadas por las empresas con estilo de venta directa al momento de la estimación de productos; esto con la finalidad de mantener la consistencia de las variables de entrada al momento de estimar la cantidad de unidades que cualquier producto deberá venderse en un futuro (Diebold, 1998).

En el caso de variables cualitativas, se procedió a identificar aquellas que generan mayor variabilidad en el comportamiento de la demanda de los productos, y posteriormente se procedió a cuantificar los impactos mediante el manejo de números índices.

Variable Fecha

Es una variable cuantitativa, generada a través de una fórmula, en la cual se identifica la época del año, en la cual se encuentra el catálogo.

En el caso de las empresas con estilo de venta por catálogo, éstos tienen una vigencia en el tiempo, los cuales pueden ser valorados numéricamente mediante la siguiente fórmula:

Variable número de vendedoras

Las empresas con estilo de venta por catálogo no colocan sus productos en automercados ni distribuidores, sino que se fundamentan en su estilo de distribución a través de vendedoras independientes. En este sentido, esta variable representa el número de vendedoras que posee la empresa durante la vigencia del catálogo.

Es necesario acotar que, al momento de realizar una estimación, se utilizarán valores estimados de vendedoras, calculados según comportamientos históricos independientes.

Variable Exposición o Publicidad de Catálogo

Representa una variable cualitativa, la cual es representada por la ubicación y diseño de la fotografía inherente al producto en el catálogo de ventas.

Para esta variable, fue necesario crear un nivel de cuantificación del impacto de cada característica dentro de cada familia de productos. En este sentido, se procedió a utilizar el procedimiento de ponderación mediante números índice simple, en donde se maneja una transformación de escala que manipula los valores para asegurar la compatibilidad con otras escalas (Webster, 2000).

PBEuna página: Promedio Base de Exposición, calculado para cada familia de productos, específicos de la característica denominada “una página”, el cual corresponde al indicador más básico y común de exposición de un producto perteneciente a cualquier familia dentro del catálogo.

PECaracterística (i): Promedio de Exposición, calculado para cada familia de productos, específicos de cada característica de exposición (i), encontrada en su base histórica de ventas.

Luego, los indicadores de impacto son calculados para cada Promedio de Exposición (PE), en comparación de su diferencia porcentual con el único Promedio Base de Exposición (PBE); esto suavizado a nivel logarítmico, para mantener la estabilidad lineal del modelo original semi - log.

En este sentido, el indicador de exposición de la característica “i” para cada familia de productos será:

De esta manera, se obtendrán tantos indicadores de exposición, como características se presenten en la data histórica inherente a la familia de productos que estamos trabajando.

Variable Promoción u Oferta de Catálogo.

Esta una variable cualitativa, que corresponde a las diferentes ofertas promociónales que la empresa coloca al artículo en cada catálogo de ventas.

Es necesario destacar, que las empresas con estilo de venta por catálogo pueden realizar merchandising controlado de precios en cada catálogo, ya que poseen el control de los precios y la duración de las promociones según la vigencia del catálogo.

Las características de esta variable se encuentran limitadas, según la información histórica a nivel de ofertas, de la familia de productos que se esté manejando.

Para esta variable, fue necesario crear un nivel de cuantificación del impacto de cada característica dentro de cada familia de productos. En este sentido, se procedió a utilizar el procedimiento de ponderación mediante números índice simple, en donde se maneja una transformación de escala que manipula los valores para asegurar la compatibilidad con otras escalas (Webster, 2000).

PBPNinguna Oferta: Promedio Base de Promoción, calculado para cada familia de productos, específicos de la característica denominada “Ninguna Oferta”, el cual corresponde al indicador más básico y común de exposición de un producto perteneciente a cualquier familia dentro del catálogo.

PPCaracterística (i): Promedio de Promoción, calculado para cada familia de productos, específicos de cada característica de promoción (i), encontrada en su base histórica de ventas.

Luego, los indicadores de impacto son calculados para cada Promedio de Promoción (PP), en comparación de su diferencia porcentual con el único Promedio Base de Promoción (PBP); y, esto suavizado a nivel logarítmico, para mantener la estabilidad lineal del modelo original semi - log.

En este sentido, el indicador de promoción de la característica “i” para cada familia de productos será:

De esta manera, se obtendrán tantos indicadores de promoción, como características de ofertas se presenten en la data histórica inherente a la familia de productos que estamos trabajando.

Variable Promoción Canibalizadora

Al manejar una gran cantidad de ofertas dentro del catálogo de ventas, existe la posibilidad de que se manejen dos (2) niveles de canibalización:

  • Canibalización Indirecta. Corresponde cuando dentro de un mismo catálogo de ventas, diversos productos de una misma familia se encuentran igualmente ofertados. Por Ejemplo: diversas cremas de manos. En este sentido, el consumidor y vendedor tendrá opción de escoger el producto en función al tipo de promoción, y por ende es necesario efectuar un balance de la demanda entre todos los productos ofertados en ese momento. Este aspecto únicamente podrá ser valorado mediante un análisis humano de un estimador, y no se contemplará como variable dentro del modelo de regresión múltiple (MRM)

  • Canibalización Directa. Corresponde cuando un mismo producto se coloca en dos (2) o mas precios diferentes dentro del mismo catálogo. Esto generalmente ocurre con promociones en donde se condiciona el precio, si adicional te llevas otro concepto que deseen impulsar.

Para esta variable, igualmente se cuantificó según el impacto de cada característica dentro de cada familia de productos. En este sentido, se procedió a utilizar el procedimiento de ponderación mediante números índice simple, en donde se maneja una transformación de escala que manipula los valores para asegurar la compatibilidad con otras escalas (Webster, 2000).

PBPCNinguna Oferta: Promedio Base de Promoción Canibalizadora, calculado para cada familia de productos, específicos de la característica denominada “Ninguna Oferta”, el cual corresponde al indicador más básico y común de exposición de un producto perteneciente a cualquier familia dentro del catálogo.

PPCCaracterística (i): Promedio de Promoción canibalizadora, calculado para cada familia de productos, específicos de cada característica de promoción canibalizadora (i), encontrada en su base histórica de ventas.

Luego, los indicadores de impacto son calculados para cada Promedio de Promoción Canibalizadora (PPC), en comparación de su diferencia porcentual con el único Promedio Base de Promoción Canibalizadora (PBPC); esto suavizado a nivel logarítmico, para mantener la estabilidad lineal del modelo original semi - log.

En este sentido, el indicador de promoción canibalizadora de la característica “i” para cada familia de productos será:

De esta manera, se obtendrán tantos indicadores de promoción canibalizadora, como características de ofertas se presenten en la data histórica inherente a la familia de productos que estamos trabajando.

Usualmente, estos indicadores son inhibidores de la demanda, ya que se utilizan principalmente para potenciar la venta de productos a los cuales enlaza y amarra.

Variables Dicotómicas, Dummy

Corresponden a las variables que exclusivamente poseen dos (2) posibles eventos de representarse: Ocurrencia y Ausencia. Estos casos cuantificados mediante el código binario 0 y 1.

0: Ausencia del Evento en la Campaña del Catálogo 1: Presencia del Evento en la Campaña del Catálogo

En estos casos, estas variables generan uniformidad en las ecuaciones de regresión a nivel de pendiente, estableciendo nuevos niveles a través de cambios en los interceptos (Casado & Montalvo, 1998).

Indicador del Tipo de Artículos

Mediante esta variable, se cuantifica el “peso” aproximado que posee cada producto de una familia correspondiente, respecto a un artículo base.

Para la realización, se tomó la cantidad promedio demandada por cada uno de los productos a nivel de SKU; para posteriormente realizar una ponderación, suavizadas a través de los logaríamos, y tomando como base la cantidad demandada del producto con mayor historial y menor nivel de demanda promedio

Modelo Lineal Dinámico Bayesiano de Orden 1 (MLDB)

Una técnica bayesiana parte de realizar un producto entre una distribución a priori para los parámetros y una función de verosimilitud o de los datos, para obtener una distribución conjunta a posteriori; seguido, se integra el producto entre ésta y la función de datos sobre el rango de parámetros para finalmente obtener la distribución predictiva (Barrera & Correa, 2008), que puede usarse para pronosticar.

Las estimaciones en el modelamiento bayesiano se establecen a partir de la función a posteriori para los parámetros, que es construida a partir del producto de la verosimilitud observada por la distribución a priori; luego de este proceso se construye una distribución predictiva complementaria para el valor a pronosticar; todo este proceso involucra la provisión de información de expertos o conocimiento del comportamiento, así como datos actualizados en el instante de tiempo previo a su estimación. (Valencia & Correa, 2013)

Este modelo, es utilizado como complemento de ajuste en los residuos, a fin de evaluar continuamente la disparidad existente entre el valor predicho (Predicción de la Demanda) y el valor real (Demanda Real), y así generar un componente de ajuste que evoluciona según el comportamiento de la demanda de cada producto en el tiempo.

La estadística bayesiana provee un marco teórico ideal para el modelaje de datos, ya que permite tratar los problemas de actualización, de una manera más fuerte que la estadística clásica, esto debido a que en la estadística bayesiana nos encontramos con una claridad axiomática y una flexibilización de cada problema en forma simultánea (Perichi, 1990), permitiendo así desarrollar inferencias coherentes.

A medida que se obtenga más información, la distribución a posteriori se puede ir actualizando, usándola como distribución a priori, así obteniéndose una nueva distribución a posteriori más actualizada. Esta es una gran ventaja que tiene el análisis bayesiano, ya que el análisis clásico frecuentista implica que a medida que se conozcan más datos, hay que reanalizar todo de nuevo (Bolstad, 2007).

Esta parte, es ejecutada por las limitaciones que presenta el modelo de regresión múltiple, específicamente cuando la demanda de artículos es afectada por variable exógenas, las cuales son desconocidas, o pertenecen al entorno macroeconómico de la economía local; específicamente en casos como: introducción o salida de competidores, modificación de la política fiscal o monetaria, situación económica del país, entre otras.

Estas causas, pueden producir alteración en los niveles de demanda según el tipo de producto, generando un nuevo nivel de la variable demanda en el tiempo, a lo cual el Modelo de Regresión Múltiple (MRM) resulta imposible de ajustarse por sí solo; a menos que se realice nuevamente la corrida de coeficiente de mínimos cuadrados ordinarios.

En este sentido, a través del Modelo Lineal Dinámico Bayesiano (MLDB), es posible determinar, con poco nivel de historia, el efecto producido por estas causas que originalmente no son contempladas por el Modelo de Regresión Múltiple (MRM); esto valorado a nivel de impacto potenciador o inhibidor de la demanda.

Este componente Bayesiano es utilizado como complemento del modelo finalmente calculado; esto a través de un estudio sobre los análisis de residuos, obtenidos por el Modelo de Regresión Múltiple (MRM), los cuales mantienen la formalidad de los supuestos de aleatoriedad ε~Nn (0, σ2.In).

Modelo Lineal Dinámico de orden 1.

Este modelo, corresponde a la segunda etapa del modelo estadístico predictivo, realizado directamente en los residuos anteriormente especificados, logrando una distribución predictiva que evolucionará en el tiempo, y cuyos niveles será añadidos al resultado de predicción futura “t+1”, proporcionado por el modelo de regresión múltiple (MRM).

Teorema 1

Para cada instante t = 1, 2, 3, consideremos las siguientes ecuaciones de observación y sistema (West, 1989 & Pericchi, 1993):

Ecuación de Observaciones

Tomando como información inicial II(µ0|D0) ~ N(m0, C0), donde mantendremos los supuestos de aleatoriedad y normalidad de residuos del modelo de Regresión Múltiple, entonces m0 = 0, y C0 = 1.

En la definición anterior, los términos de las sucesiones {υt} y {ωt}, son mutuamente independientes. Para la distribución (µ0|D0), D0 es la información inicial, m0 es un estimado para el nivel de la serie y C0 es la incertidumbre sobre la media m0.

Para cada t, supondremos que Dt-1 recoge toda la información sobre D0, Vt, Wt, Yt, Yt-1, entonces la única información nueva para cada “t”, será Dt = {Yt, Dt-1} (West, 1989).

En este sentido, como es un sistema generado para los residuos, tomaremos Wt = 1, manteniendo los niveles de aleatoriedad entre µt y µt-1; sin embargo, como “yt”, corresponde a una ecuación de observación creada según los valores de aprendizaje del sistema, utilizaremos subjetivamente una varianza Vt = 10, para generar un filtro bayesiano de aprendizaje de aproximadamente 27% de la diferencia entre valor predicho y valor demandado.

Teorema 2 (West, 1989 & Pericchi 1993) Posteriori de µt-1:

En esta sección se inicia el estudio bayesiano, basado en los datos provenientes de la campaña de ventas anterior a la que se está estudiando.

II(µt-1|Dt-1) ~ N(mt-1, Ct-1)

En donde, m0 = 0 y C0 = 1, manteniendo el supuesto de aleatoriedad de residuos anteriormente argumentado.

Priori de µt:

Con esta distribución, se simula el comportamiento de µt, con los datos a tiempo “t-1”

II(µt|Dt-1) ~ N(mt-1, Rt)

Donde Rt = Ct-1 + Wt. que específicamente para este modelo complementario de residuos, sería Rt = Ct-1 + 1.

Predictiva yt:

Con esta distribución, se predice el valor que poseerá el error a tiempo “t”, con los datos actualizados a “t-1”. Este será el valor que será precisamente el que se agregue al resultado proporcionado por el modelo de regresión múltiple (MRM).

II(yt|Dt-1) ~ N(ft, Qt)

Donde, ft = mt-1; y adicionalmente, Qt =Rt + Vt, teniendo en consideración que para este análisis en particular se estableció Vt = 10.

Esta etapa, se considera la de mayor importancia, ya que se obtiene una predicción del error actual presente entre la diferencia de los valores predichos por el modelo de regresión múltiple y la demanda real de cada producto, proporcionado por la data histórica hasta t-1.

En este sentido, la predicción del final del modelo predictivo sería:

Ln(Demanda ) = Resultado MRM + ft

Donde ft, se obtiene con información histórica actualizada hasta tiempo t-1. Posteriori para µt (Cierre de ciclo)

Una vez obtenida la data histórica hasta el tiempo t, se puede calcular la distribución posteriori para los errores en este tiempo, cerrando así el ciclo del Modelo Lineal Dinámico bayesiano (MLDB).

Para esta sección, se calculan los siguientes términos:

  • et: Indica la falla, o diferencia entre el error original a tiempo t, y el estimado por el modelo anteriormente et = Error Originalt - ft. En este aspecto, se define como Error Original, a la diferencia entre el valor predicho por el modelo de regresión múltiple (MRM) y el valor de la demanda real, suavizado a través de la función logarítmica.

  • At: Término utilizado como porcentaje de filtro, que indicará la porción de falla o diferencia, que debe ser añadida como aprendizaje al nuevo valor de mt.

Debido a que Vt = 10, el filtro generado por At, convergerá aproximadamente a 27,015%. En este sentido, el dato a posteriori de mt, tomará como información el valor anterior mt.-1 más del 27,015% de et.

Luego, la distribución para el error a tiempo t, será:

II(µt|Dt) ~ N(mt, Ct)

Donde:

mt = mt-1 + At.et

Ct = At.Vt

Análisis Dual de Residuos Finales.

Luego de realizar el MRM (MRM), se procederá a realizar un análisis detallado de los residuos expuestos para cada modelo estadístico, realizado sobre la data suministrada por empresas multinacionales, suavizadas a través del logaritmo natural de la cantidad demandada de artículos por catálogo de ventas. El estudio de residuos se fundamentará en los residuos lineales de la variable ln(Demanda).

Así mismo, se procederá a realizar un análisis de residuos, posterior al uso del complemento generado por el MLDB, a fin de observar las potencialidades de mejora luego de utilizar este factor.

Presencia de Homocedasticidad

Se valorará el supuesto correspondiente a la estabilidad de la varianza de los residuos en toda la familia de productos trabajada. Este análisis se realizará a través de gráficos de dispersión respecto a la cantidad demandada por catálogo en los productos de las familias seleccionadas.

Histograma de residuos

Para el análisis de residuos, se realizaron histogramas para los residuos del modelo de regresión múltiple, observando su comportamiento y tendencia de normalidad.

Independencia de los errores: Análisis de auto - correlación:

Para valorar el supuesto de independencia entre los residuos, y la ausencia de algún patrón de autocorrelación entre ellos provenientes de los modelos MRM, se utilizó el estadístico de Durbin - Watson.

Donde et es el error de la ecuación en el período de tiempo t, y et-1 es el error o diferencia entre el error estimado por el modelo y la demanda real proveniente de la historia en el período anterior t-1.

EJEMPLO PRÁCTICO MODELO ESTADÍSTICOS DESARROLLADOS

Tomando estas variables de entrada, fue posible realizar diversas corridas en familias de productos de Avon Cosmetics, logrando resultados interesantes a nivel de ajuste, consistencia y robustez.

En los estudios manejados, se lograron niveles de ajuste a nivel de R2 entre 70% y 80%, con una mínima multicolinealidad entre las variables, y un comportamiento estadístico de residuos estadísticamente aceptables, a nivel de aleatoriedad y normalidad y con amplia estabilidad en la varianza.

A continuación, se expone los resultados de dos familias, calculadas para esta compañía multinacional.

Familia: Cremas Damas

Definición: Corresponde todos los productos inherentes a cremas de rostro, de manos y cuerpo, dirigida especialmente para el público femenino.

Al momento de efectuar las corridas y actualización de indicadores β, de la ecuación de regresión, tenemos los siguientes resultados para la familia de Cremas Damas:

Tabla 1 Codificación de las Variables de Entrada 

Nombre de la variable Codificación de la variable Influencia sobre el ln(demanda)
Constante
Variable número de vendedoras V14 Potenciadora
Indicador del tipo de artículo V22 Potenciadora
Indicador de precio V25 Potenciadora
Variable exposición V26 Potenciadora
Variable promoción V27 Potenciadora
Variable promoción canibalizadora V28 Potenciadora
Variable fecha V30 Inhibidora

Fuente: Autor con base en resultados de la investigación

En este sentido, la ecuación de regresión multivariada para esta familia en particular con la información procesada a través de la aplicación estadística S-Plus (Chambers, 1992), sería la siguiente:

Ln(Demanda) = 584,24070000 + 0,00005115 * V14 + 0,03804392 * V22 + 0,92267330 * V25 + 0,00186840 * V26 + 0,00214361 * V27 + 0,00770710 * V28 - 0,28957090 * V30

A nivel de p-valor y pruebas “t” para identificar su efecto significativo sobre la variable dependiente, tenemos que todas las variables tomadas en consideración son significativas, con un coeficiente R2 de determinación múltiple de 73,89%.

Tabla 2 Coeficientes del Modelo de Regresión Múltiple (Salida S-plus) 

Value Std, Error t value Pr(>|t|)
(Intercept) 584,2407 51,4747 11,3500 0,0000
V14 0,0001 0,0000 4,3048 0,0000
V22 0,0380 0,0011 35,0081 0,0000
V25 0,9227 0,0840 10,9833 0,0000
V26 0,0019 0,0003 7,2831 0,0000
V27 0,0021 0,0001 26,7492 0,0000
V28 0,0077 0,0007 10,6515 0,0000
V30 0,0257 -0,2896 -11,2553 0,0000

Residual standard error: 0,7434 on 1502 degrees of freedom Multiple R-Squared: 0,7389

F-statistic: 607,2 on 7 and 1502 degrees of freedom, the p-value is 0

Fuente: Autor con base en resultados de la investigación

Matriz de Correlación

En este aspecto, al mostrar la matriz de correlación lograda con esta ecuación de regresión, observamos una reducida multicolinealidad entre las variables, lo que indica una garantía del supuesto en donde las variables explicativas debían ser independientes, separando de esta manera los efectos individuales de cada variable independiente sobre la cantidad demandada de artículos (Tatsuoka, 1991).

Tabla 3 Matriz de Correlación de las variables causales del Modelo de Regresión Múltiple 

Intercept V14 V22 V25 V26 V27 V28 V30
V14 0,5577
V22 0,2680 0,0146
V25 0,0590 0,0688 0,3503
V26 -0,0070 0,0008 -0,0624 -0,0107
V27 -0,0355 0,0169 -0,2816 -0,3956 -0,1742
V28 -0,0397 -0,0459 0,0464 -0,0154 0,0802 -0,2476
V30 -1,0000 -0,5620 -0,2678 -0,0596 0,0070 0,0353 0,0400

Fuente: Autor con base en resultados de la investigación

Estudios y Análisis de Residuos.

Finalmente, analizando los gráficos residuales observamos la presencia de aleatoriedad en los mismos, con varianza estable y estabilidad y ajuste con la distribución normal.

Fuente: Autor con base en resultados de la investigación

Gráfico 4 Análisis Inicial de Residuos del Modelo Estadístico de Regresión Múltiple. 

En estos gráficos, podemos observar que los valores calculados por el modelo estadístico se ajustan a los datos reales del logaritmo de la demanda; así como también una normalidad de los residuos según se ajuste a la línea de normalidad y simetría en los residuos.

Para esta familia, el indicador de Durbin Watson que se obtiene, arroja un valor correspondiente a 1,80871863, lo que indica una ausencia de autocorrelación entre los residuos.

Luego, se procedió a trabajar directamente sobre los residuos obtenidos en el modelo de regresión múltiple (MRM), logrando el uso de un modelo lineal dinámico bayesiano (MLDB), que genera un componente adicional de información, que nos permiten ajustar las predicciones del nivel de demanda, en función al aprendizaje continuo entre las predicciones del modelo en el período “t-1” y los resultados reales, obtenidos en el tiempo “t”.

Nuevo Modelo Predictivo

Luego de aplicar el componente adicional del MLDB, logrando el modelo final predictivo: Ln(Demanda ) ≈ Modelo Final (MF) = Resultado MRM + ft (MLDB) + t

Este nuevo modelo estadístico predictivo de dos (2) componentes, comprende un componente aditivo, determinado según la distribución posteriori de los residuos, y maneja para el caso de cremas damas, un coeficiente R2 de determinación múltiple de 72,7%, un coeficiente de Durbin Watson de 2,171; adicionalmente, analizando este segundo nivel de residuos t , tenemos:

Fuente: Autor con base en resultados de la investigación

Gráfico 5 Análisis Posterior de Residuos, luego de aplicar el Modelo Lineal Dinámico 

Se observa a nivel práctico, como luego de aplicar el Modelo Lineal Dinámico Bayesiano a los residuos del Modelo de Regresión Múltiple, se generó un factor ft el cual es asimilado por el modelo estadístico de predicción, y fueron generados unos nuevos residuos, los cuales poseen un mejor comportamiento gaussiano.

De esta manera, se puede derivar un efecto positivo de este nuevo componente en la estabilidad y robustez residual del modelo estadístico predictivo, calculado originalmente por el modelo de regresión múltiple (MRM), así como también la capacidad de ajuste que tendría el modelo estadístico predictivo en comparación con el MRM, que por sí mismo no es capaz de actualizarse automáticamente según los residuos que vaya experimentando el modelo.

DISCUSIÓN DE RESULTADOS

Este componente bayesiano, genera una predicción ajustada por nuevo nivel de demanda para cada artículo, calculado a través de un aprendizaje a priori según los errores et manejados entre la predicción del MRM y el logaritmo de la demanda.

Este nuevo nivel de demanda para cada artículo genera un nivel ajustable automáticamente en el tiempo "t", que mantendrá la consistencia del modelo de regresión múltiple en productos que incrementen o disminuyan su nivel de demanda a medida que evolucionan en el tiempo.

Supongamos un ejemplo, en donde observemos el historial de un producto (Foot Works Crema Suavizante) durante treinta y seis campañas de historia (equivalente a 2 años en Avon Cosmetics), en este sentido, el ajuste se observa muy similar entre la estimación lograda a través del modelo de regresión múltiple (MRM) y el modelo estadístico final (MF), que posee el complemento del modelo lineal dinámico bayesiano (MLDB).

Fuente: Autor con base en resultados de la investigación

Gráfico 6 Comparativo entre las Estimaciones y los Modelos Estadísticos de MRM (Frecuentista) y el Modelo Final MF (MRM + Componente Bayesiano). Caso Producto Estable. 

Sin embargo, en el caso eventual de que un determinado producto comience a elevar (o disminuir) paulatinamente su nivel de demanda en los últimos catálogos de ventas, producto de situaciones macroeconómicas o por el desempeño de competencia no contempladas en el modelo original de regresión, se aprecia una disparidad entre el comportamiento de la demanda real y las predicciones del modelo de regresión múltiple (MRM).

Fuente: Autor con base en resultados de la investigación

Gráfico 7 Comparativo entre la demanda real (suavizado logarítmicamente), el modelo de regresión múltiple (MRM) y el modelo estadístico final (MF), que posee el complemento del modelo lineal dinámico bayesiano (MLDB). Caso donde la demanda del producto es creciente en el tiempo (tendencia creciente). 

Estas diferencias son efectivamente cubiertas a través del complemento calculado y articulado por el modelo lineal dinámico bayesiano (MLDB), el cual genera un componente que aprende en función de la diferencia et, experimentada entre el ln(Demanda) y la estimación del MRM. Logrando así un Modelo Final MF (MRM + Componente Bayesiano) consistente con las estimaciones individualizadas por SKU en el tiempo, ideal para ser programado en una herramienta automatizada de simulación y predicción de la demanda.

Este artículo expone un procedimiento de modelaje estadístico predictivo; en donde es posible unificar dos tendencias de la estadística: la estadística frecuentista, y la estadística bayesiana en un solo modelo, garantizando el poder predictivo y de valoración de variables causales de un modelo de regresión múltiple, con la versatilidad de actualización automática que sólo poseen los modelos estadísticos bayesianos, aplicado en forma creativa a los residuos del modelo estadístico principal.

Finalmente, un modelo estadístico de proyección para empresas no debe concebirse como un competidor del estimador o planificador de la demanda, sino más bien como una herramienta fundamental, que le permita realizar consultas en tiempo real, con la versatilidad de simular escenarios futuros, mediante modelos estadísticos que sólo valoran información de técnicas anteriormente realizadas, pero nunca podrán valorar exactamente las creatividades de las nuevas estrategias.

REFERENCIAS

Barrera, C. J. & Correa, J. C. (2008). Distribución predictiva bayesiana para modelos de pruebas de vida vía MCMC. Revista Colombiana de Estadística, 31(2), 145-155. [ Links ]

Boada, A.J. & De Vasconcelos, D. (2013). Modelo estadístico de regresión múltiple, columna vertebral para predecir en empresas multinacionales con estilo de venta por catálogo. Revista Lasallista, 10(1), 112 - 127. [ Links ]

Boada, A. & Mayorca, R. (2011). Planificación de Demanda, en Empresas con Estilo de Venta por Catálogo. Revista Lasallista , 8(2), 124 - 135. [ Links ]

Bolstad, W. M. (2007). Introduction to Bayesian Statistics. Hamilton, NZ: Wiley. [ Links ]

Casado, R. & Montalvo, F. (1998). Diseño de un Modelo Estadístico Predictivo, para las ventas, en unidades, de las diferentes líneas de labiales en barras de Avon Cosmetics de Venezuela C.A. (Trabajo de Grado). Caracas, Biblioteca de la Universidad Metropolitana (Físico). Escuela de Ciencias Administrativas. [ Links ]

Chambers, J.M. & Trevor J. Hastie (1992). Statistical Models in S. New York: Wadsworth & Brooks/Cole. [ Links ]

Chase, R., Jacobs, R. & Aquilano, N. (2005). Administración de la Producción y Operaciones para una Ventaja Competitiva. Buenos Aires: McGraw Hill. [ Links ]

Diebold, F.X. (1998). Elements of Forecasting. San Diego: South Western College Publishing. [ Links ]

Malhotra, N.K. (1997). Marketing Research: An Applied Orientation. Georgia, ATL: Prentice Hall. [ Links ]

Klepacki L. (2005). AVON La construcción de un imperio femenino. México: Editorial: Aguilar [ Links ]

Kotler, P. Armstrong, G. (1994). Mercadotecnia. México: Pearson [ Links ]

Levin, Richard & David Rubin (1996). Estadística para Administradores. Buenos Aires: Prentice Hall. [ Links ]

Montgomery, D., Peck, E., & Vinning, G. (2006). Introducción al Análisis de Regresión Lineal. México: Continental. [ Links ]

Pericchi, L.R. (2002). Análisis de Decisión, Inferencia y Predicción Estadística Bayesiana. Caracas: Universidad Simón Bolívar. [ Links ]

Schiffman, L., Kanuk, L. (2010). Comportamiento del Consumidor. México: Pearson [ Links ]

Tatsuoka, M.M. (1991). Multivariate Analysis: Techniques for Educational and Psychological Research. Chapaign: University of Illinois. [ Links ]

Valencia C, Marisol & Correa M, Juan C. (2013). Un Modelo Dinámico Bayesiano para el Pronóstico de Energía Diaria. Revista Ingeniería Industrial, 12(2), 7 - 17. [ Links ]

Webster, A.L. (2000). Applied Statidtics for Business and Economics. New York: McGraw - Hill. [ Links ]

West, M. & Harrison, J. (1989). Bayesian Forecasting and Dynamic Models. New York: Springer - Verlag. [ Links ]

*Artículo de investigación financiado por la Universidad Simón Bolívar, Valle Camurí Grande, www.usb.ve .

FORMA DE CITACIÓN: Boada, Antonio. J. (2017) Modelo lineal dinámico bayesiano como procedimiento de actualización automática para modelos estadísticos predictivos. Dimensión Empresarial, 15(1), 33-52. DOI: http://dx.doi.org/10.15665/rde.v15i1.547 JEL: C11, C12, C13

Recibido: 15 de Octubre de 2015; Aprobado: 02 de Diciembre de 2016

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons