Comparación de pronósticos para la dinámica del turismo en Medellín, Colombia

Valencia, Marisol; Vanegas, Juan; Correa, Juan; Restrepo, Jorge; Valencia, Marisol; Vanegas, Juan; Correa, Juan; Restrepo, Jorge

doi:10.17533/udea.le.n86a08

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

Lecturas de Economía

Print version ISSN 0120-2596

Lect. Econ. no.86 Medellín Jan./June 2017

https://doi.org/10.17533/udea.le.n86a08

Artículos

Comparación de pronósticos para la dinámica del turismo en Medellín, Colombia

Comparing forecasts for tourism dynamics in Medellín, Colombia

Comparaison des prévisions pour la dynamique du tourisme dans la ville de Medellin, Colombie

Marisol Valencia^*

Juan Vanegas^**

Juan Correa^***

Jorge Restrepo^****

¹* Marisol Valencia Cárdenas: Docente, Institución Universitaria Tecnológico de Antioquia.Colombia. Di rección electrónica: mvalencia@unal.edu.co.

²** Juan Gabriel Vanegas López: Docente-Investigador en la Fundación Universitaria Autóno ma de las Américas. Facultad de Ciencias Económicas y Administrativas, Grupo de In vestigación GICEA, Medellín, Colombia. Dirección electrónica: juan.vanegas@uam.edu.co; jg.tecnologico@gmail.com

³*** Juan Carlos Correa Morales: Profesor Asociado, Universidad Nacional de Colombia, Sede Me dellín. Colombia. Dirección electrónica: jccorrea@unal.edu.co.

⁴****Jorge Aníbal Restrepo Morales: Docente, Institución Universitaria Tecnológico de Antioquia. Colombia, Dirección electrónica: jrestrepo@tdea.edu.co

Resumen

El turismo es un tema de interés para muchos países, pero en Colombia ha sido poco explorado. Conocer sobre periodos con mayor afluencia de turistas es importante para predecir la cobertura en servicios turísticos. En este trabajo se compara la estimación entre modelos de regresión clásica y bayesianos para elegir la mejor alternativa de predicción de la cantidad de turistas que arribarían a la ciudad de Medellín. Se busca también determinar las variables que más inciden sobre la llegada de turistas y los modelos que permiten ajustar mejor sus dinámicas. Dentro de los resultados obtenidos se observa mejor desempeño de los modelos bayesianos versus los clásicos. Además, la variable mes es significativa para explicar las demandas por parte de turistas colombianos y extranjeros. Los periodos de mayor afluencia de turistas se presentan entre diciembre-enero y junio-julio, comportamiento que se repite anualmente, lo cual es decisivo para la planeación de recursos hoteleros.

Palabras clave: demanda turística; evaluación de modelos y selección; métodos de pronóstico y predicción; estadística bayesiana; Medellín

Abstract

Tourism is a topic of interest to many economies around the world, but it has received limited attention in Colombia. Knowing the periods of larger tourist inflows is important for predicting coverage in services for tourists. In this paper, we compare the estimation between classical and Bayesian regression in order to choose the best alternative to predict the number of tourist arrivals to Medellin. We also identify the most significant variables affecting the influx of tourists and the models providing better fit to the associated dynamics. According to our results, the Bayesian approach shows better estimates than the classic one. In addition, the variable month is significant to explain the demands for both Colombians and foreigners. The periods with the highest incidence of visits to the city are December-January and June-July, a pattern that repeats itself every year, which is crucial for planning hotel resources.

Keywords: tourism demand; model evaluation and selection; forecasting and prediction methods; Bayesian statistics; Medellín.

Résumé

Le tourisme est un sujet de recherche dans des nombreux pays, mais en Colombie il reste peu exploré. Par exemple, le fait de connaitre les périodes de l’année avec les plus de touristes permet de mieux prédire la couverture des services touristiques. Cet article établi une comparaison entre les estimations issues à partir des modèles classiques et des modèles de régression bayésienne, afin de choisir la meilleure méthode de prédire le nombre de touristes qui arrivent à la ville de Medellin. L’article vise également une étude de la détermination des variables qui expliquent l’arrivée des touristes, afin d’identifier les modèles qui mieux expliquent sa dynamique. Les résultats obtenus montrent que la performance des modèles bayésiens est beaucoup mieux que celle des modèles classiques. En outre, la variable « mois » est significatif dans l’étude de la demande des services touristiques, aussi dans le cas des touristes colombiens qu’étrangers. Les périodes de l’année avec le plus d’affluence sont Décembre-Janvier et Juin-Juillet. Il ságit d’une information très utile à la planification des ressources hôteliers.

Mots-clés: demande de services touristiques; évaluation et sélection des modèles; méthodes de prédiction et de prévision; statistique bayésienne; Medellin.

Introducción

El pronóstico de la demanda del sector turístico es un tema reconocido a nivel mundial. Diversos estudios emplean modelos de pronósticos para su caracterización y análisis de comportamiento, identificando, por ejemplo, co variables con incidencias significativas o patrones estacionales y tendencias (^{Guizzardi & Mazzocchi, 2010}). Muchos de estos modelos van desde la teo ría clásica, o econométrica, hasta propuestas que comparan modelos clásicos con redes neuronales, como sucede en el trabajo de ^{Claveria y Torra (2014}).

Algunos temas relacionados con la teoría de modelos de pronósticos clá sicos, como es el caso de la regresión, presentan problemas asociados con la presencia de sesgos al pronosticar, debido a que cuando se prolonga el pe ríodo de predicción en el modelo con parámetros fijos se puede incurrir en predicciones erróneas. En otros casos hay algunos supuestos de los residuales que no se cumplen con facilidad, por presentar problemas como valores muy extremos, o un cambio repentino en el curso normal de una serie de tiempo.

Cuando la escala de la variable de respuesta inicial es de tipo discreto se pueden usar modelos de pronóstico basados en la distribución Poisson, y si toma valores de respuesta muy altos (más de 100) es posible realizar pronós ticos aproximados con modelos basados en datos con distribución Normal. Otros estudios aplicados a datos de conteo muestran algunos modelos sim ples como distribuciones empíricas o modelos de suavización exponencial. ^{Kolasa (2016}) compara pronósticos realizados con distribuciones empíricas, con la Poisson y Binomial Negativa; por otro lado, ^{Wallström y Segerstedt (2010}) comparan el método de suavización exponencial con otros como el de Croston.

Se observa, entonces, que la literatura exhibe estudios que muestran resul tados de pronósticos elaborados con modelos clásicos basados en la distribu ción normal o en la Poisson, pero también estudios de modelos con diferentes teorías de estimación como la bayesiana (Zellner, 1996; ^{Valencia, 2016}).

La comparación de pronósticos de la demanda del sector turístico en Me dellín es un tema que no ha sido abordado en Colombia usando modelos de regresión clásica y de regresión Bayesiana. En este trabajo se propone com parar un modelo de pronósticos econométrico clásico con dos bayesianos: uno basado en la regresión del autor Zellner, que asume una distribución normal para los datos y parámetros, y otro basado en MCMC (Monte Carlo por Cadenas de Markov), que asume la distribución Poisson para los datos y parámetros bajo la Distribución Normal Multivariada. Estos modelos son aplicados al caso de entradas de turismo a la ciudad de Medellín, Colombia, sin modificar las distribuciones de probabilidad iniciales para este trabajo. Es to puede proponerse en futuras aplicaciones, incluso, con diferentes formas de muestreo.

Con esta investigación se busca responder los siguientes interrogantes: ¿cuáles variables tienen más incidencia sobre la llegada de turistas a la ciu dad (fechas, clima, estaciones, meses)?, ¿con cuáles modelos es posible ajustar mejor la dinámica de demanda de turismo?, ¿la teoría Bayesiana es útil para efectuar pronósticos sobre la demanda de turismo?

Este artículo se presenta en el siguiente orden. En la sección I, se mues tra una revisión de literatura. En la sección II, se muestran los modelos a estimar e indicadores comparativos. En la sección III, se presentan los re sultados, donde se mostrará una exploración de datos y los modelos estima dos para ambas series de turistas (colombianos y extranjeros). La sección IV muestra la discusión de resultados. Finalmente se presentan las conclusiones y referencias.

I. Revisión de la literatura

El turismo en el mundo ha sido un tema de interés para la economía de muchos países (^{Crouch, 1995}; ^{Guizzardi & Mazzocchi, 2010}; ^{Lim, 1999}; ^{Peng, Song & Crouch, 2014}; ^{Zhou, Bonham & Gangnes, 2007}). La deman da en este sector ha sido analizada desde el punto de vista de pronóstico en numerosos estudios a nivel internacional (Guizzardi & Stacchini, 2015; Song, Gao & Lin, 2013; ^{Liu et al., 2014}). Algunas de las revisiones literarias muestran una descripción completa de los métodos usados en la modelación y pronós tico de las demandas turísticas, que van desde las perspectivas econométricas clásicas has las nuevas técnicas de pronóstico emergentes, que emplean teoría estadística o matemática (^{Witt & Witt, 1995}; Li, Song & Witt, 2005; Song & Li, 2008).

No obstante, en Colombia algunos estudios realizados se han centrado en el análisis del gasto, o en los servicios que se ofrecen al turista. Den tro de este grupo de trabajos se puede resaltar el efecto de la seguridad y el comercio, abordado por ^{Bonilla y Moreno (2010}), quienes, mediante un modelo de datos de panel, encuentran que los arribos de viajeros extranjeros es tán inversamente relacionados con los secuestros, y el índice de intercambio comercial lo hace de forma positiva. Otros trabajos han analizado las diná micas locales de los movimientos de viajeros. ^{Cerda y Leguizamón (2005}), por ejemplo, encuentran por medio de modelos hedónicos que la demanda interna de agentes nacionales por consumo de un bien turístico depende en gran manera del perfil del jefe de hogar, su poder adquisitivo y la composi ción familiar. A nivel de municipalidades o locaciones específicas, por ejem plo el caso de Cartagena, los estudios se centran en observar el impacto de las fluctuaciones cambiarias en la demanda turística (^{Galvis & Aguilera, 1999})^². Ahora bien, no se ha hecho un comparativo en pronósticos que evalúe los efectos estacionales de las demandas turísticas para la ciudad de Medellín, caracterizando a su vez, algunos factores controlables, que son importantes para proveer herramientas de planeación para el sector turístico y fomentar estrategias de mejoras en los servicios que se ofertan.

El tipo de modelos propuestos para el pronóstico, a nivel internacional, varía acorde con algunas características de las series de demandas turísticas, por ejemplo, hay estudios de su comportamiento lineal o no lineal (^{Chen, 2011}); pero también se estudia la relación de flujos de turistas con las capa cidades de alojamientos (^{Zhou et al., 2007}), o la inherencia de esta demanda con su ciclo de negocios (^{Guizzardi & Mazzocchi, 2010}).

Existen modelos en los que se relaciona el pronóstico de demandas, con la optimización de recursos, como el caso de demandas e inventarios; para ello, se han usado muchos modelos estadísticos clásicos (^{Bes & Sethi, 1988}; ^{Gutiérrez & Vidal, 2008}; ^{Choi, Li & Yan, 2003}; ^{Samaratunga, Sethi & Zhou, 1997}; ^{Sarimveis et al., 2008}) y luego su salida es usada para modelar los in ventarios. Vidal, Londoño y Contreras (2004), por ejemplo, implementan téc nicas sencillas de pronósticos y de control de inventarios. ^{Cohen y Dunford (1986}) proponen un modelo basado en una distribución empírica para la de manda y afirman que el requerimiento de una distribución normal para los residuales de los modelos ARIMA (Modelos Integrados Autorregresivos de Medias Móviles) y de regresión no se cumple en muchos casos. ^{Shoesmith y Pinder (2001}) emplean modelos VAR (Vector Autorregresivo) y BVAR (Ba yesian Vector Autorregresivo), usando pocos datos de la demanda de los pro ductos estudiados.

Frente a modelos para datos de conteo, existen trabajos comparativos recientes, basados en distribuciones empíricas, Poisson y Binomial negativa, presentados en ^{Kolasa (2016}), el cual está basado en ^{Syntetos et al. (2011}). A partir de una comparación de indicadores de error con probabilidad, estos trabajos encuentran un mejor desempeño de modelos basados en distribu ción empírica en comparación con los de la distribución Poisson y Bootstrap. Por su parte, ^{Wallström y Segerstedt (2010}) presentan el suavizado exponen cial simple (SES-Single Exponential Smoothing) versus Croston y algunas variaciones, aplicados para demandas intermitentes o no^³, y encuentra que el modelo SES tiene mejor desempeño frente al de Croston cuando utiliza diferentes indicadores de error para elegir el mejor modelo. Para el caso del tema turístico, se encuentra el trabajo de ^{Hellström (2002}) que estima mode los de valor entero autorregresivos de media móvil (INARMA) para estudiar la interacción entre la elección del número de viajes de ocio de los hogares y el número de pernoctaciones.

La estadística Bayesiana ha ganado importancia para efectuar pronósti cos hace algún tiempo. Por ello, se han elaborado diferentes trabajos y textos basados en inferencia predictiva, valor esperado o modelos dinámicos baye sianos que muestran su utilidad para elaborar pronósticos, de forma univaria da o multivariada, basados en información a priori para los parámetros, para los datos y, quizá, información de expertos (^{Fei, Lu & Liu, 2011}; ^{Harrison & Stevens, 1976}; ^{De Mol, Giannone & Reichlin, 2008}; ^{Neelamegham & Chinta gunta, 1999}; ^{West & Harrison, 1997}; ^{Valencia, 2016}). Un modelo de regresión Bayesiana, que es desarrollado en Zellner (1996), se basa en una distribución no informativa para los parámetros y una distribución normal para los datos, lo cual es posible suponer de manera aproximada cuando la serie de datos tie nen valores muy grandes, así sean discretos, como son la cantidad de turistas de las series temporales de este trabajo. Este modelo será usado para pronosticar la serie mensual de turistas que ingresan a la ciudad de Medellín, en el periodo temporal de 2007 a 2014, y su ajuste será comparado con un mode lo de pronósticos econométrico clásico, y otro bayesiano basado en MCMC (con MCMCpoisson), para determinar así, cual es el mejor modelo que facilite la mejor interpretación del comportamiento de dicha serie de turistas.

II. Métodos

Para iniciar el análisis en series temporales, se hace un corte en la serie de datos, de N valores, T(T < N) serán usados para analizar correlación y análisis descriptivo y para estimar modelos; los N − T restantes serán usados para validar la estimación y para determinar si el modelo tiene una capacidad de pronóstico adecuada. Se realiza un análisis estadístico detectando inicial mente valores atípicos y problemas de variabilidad de los valores de demanda turística de la ciudad de Medellín.

A. Modelo econométrico

El modelo econométrico es un modelo de regresión que contempla va riables autorregresivas endógenas, así como otras exógenas que pueden estar asociadas a la respuesta zt (Caridad y Ocerin, 1998; ^{Bowerman, Oconnell & Koheler, 2007}), partiendo de la ecuación general dada por (1):

() 1

Dentro de las covariables a estudiar se encuentran: rezagos de primer or den y estacional, el tiempo, una variable sinusoidal, variable mes como factor, temperatura, IPC, TRM y el consumo de energía por actividad económica. Se realizará un proceso de selección de variables de tipo paso a paso, vali dando el modelo final con las premisas de residuos (normalidad, varianza e incorrelación) y obteniendo al final el indicador de ajuste MAPE (error medio absoluto porcentual) y error relativo de pronóstico, con mayor eficiencia para la predicción. Estos indicadores de error serán comparados con el modelo de regresión clásica.

El MAPE suele ser útil para expresar de una forma simple, en términos porcentuales genéricos, el error cometido, incluso para alguien que no tiene idea de lo que constituye un error de “grande” como, por ejemplo, lo relativo a grandes montos de dinero; en especial, este indicador puede ser adecuado para cantidades que son mayores de una unidad. Cuando toma valores cerca nos a cero, se recurre más a menudo a utilizar el indicador MSE (Mean Square Error), RMSE (Root of Mean Square Error), sMSE (scale Mean Square Error) (^{Kolasa, 2016}), o incluso la medida sMAPE (symmetric Mean Absoute Per centage Error) (^{Wallström & Segerstedt, 2010}), ya que no incrementa más el porcentaje de error en estos casos cercanos al cero. Autores como ^{Petris, Pe trone y Campagnoli (2009}), quienes muestran en su libro aplicaciones de los modelos dinámicos bayesianos usando el software R, mencionan que el MA PE es una de las estadísticas más usadas para comparación de pronósticos, y se utiliza junto con otras dos: MAD (Mean Absolute Deviation) y MSE o RMSE, para comparar modelos.

En este trabajo se usan los criterios RMSE, MAPE y sMAPE (ver ecua ciones (2), (3) y (4)) para medir el desempeño en el ajuste y pronóstico sobre estimaciones de modelos clásicos y bayesianos, con respuestas que toman va lores muy altos y diferentes de cero, como son las series de tiempo de cantidad de turistas usadas aquí. Además de esto, se realizan procesos de selección y pruebas con relación a la significancia de covariables y, adicionalmente, prue bas de normalidad.

()2

()3

()4

B. Modelo de regresión lineal bayesiano basado en la normal para los datos

En la teoría de la toma de decisiones, la probabilidad juega un papel fun damental. Las probabilidades previas de estados de la naturaleza pueden ser consideradas a priori con un carácter subjetivo, pero pueden diferir un poco de las reales (^{Hillier & Hillier, 2007}). Con base en los principios del teorema de Bayes, al combinar el producto entre una probabilidad a priori con una condicionada a un hecho se obtiene lo que se conoce como probabilidad a posteriori. Estos principios son utilizados por la estadística bayesiana para inferir, por ejemplo, usando predicciones (^{Gill, 2007}; ^{Gelman et al., 2004}).

En la Estadística Bayesiana, los parámetros de la ecuación de regresión no son fijos, sino que se pueden comportar acorde con una función de distribu ción, llamada a priori. Al utilizar el teorema de Bayes, es posible usar la premisa acerca de que el producto entre la distribución a priori para el parámetro y la verosimilitud de los datos genera un conocimiento de dicho parámetro, por medio de la distribución a posteriori. Zellner (1996) realiza la construcción del modelo de regresión a partir de las premisas: una distribución a priori no informativa: 1/σ, para los parámetros β, τ del modelo, y una distribución normal para los datos; con ello se construye la verosimilitud de la muestra. El producto entre dicha distribución a priori y la verosimilitud genera la a poste riori de dichos parámetros. Seguido a esto, la integral entre la distribución de los datos, multiplicada por la distribución a posteriori, genera la distribución predictiva bayesiana, función finalmente usada para pronósticos de la variable respuesta.

Zellner (1996) propone el uso de una distribución a priori no informativa: 1/σ para los parámetros. La función de verosimilitud de los datos, basada en la distribución normal, está dada por (5):

() 5

Luego del producto entre la distribución a priori por la verosimilitud (5) se obtiene la distribución a posteriori (6):

() 6

donde

La distribución predictiva, obtenida luego de hacer la integral entre la dis tribución de los datos y la distribución a posteriori (6), es una distribución T de Student (Zellner, 1996), con la cual se generan las estimaciones de la respuesta buscada, en este caso: turistas colombianos y turistas extranjeros, usando X como la matriz de diseño donde se incluyen las covariables.

C. Modelo de regresión Poisson bayesiano

Este modelo parte de las premisas de una distribución Poisson para los datos y una distribución a priori Normal Multivariada para el vector de pará metros β, que permiten obtener una distribución a posteriori de los paráme tros del modelo de regresión. La estimación del modelo puede hacerse con el paquete MCMCpack del programa R (^{Martin, Quinn & Park, 2011}), cuya fun ción MCMCpoisson, permite muestrear los parámetros de dicha distribución a posteriori, usando un algoritmo llamado Metropolis de caminata aleatoria. Con esto se obtienen estadísticas para cada uno de los parámetros, como la media o los percentiles, que se reemplazan como parámetros del modelo de regresión y, de ésta forma, encontrar la respuesta media, que es el logaritmo natural de la serie original de los datos.

En resumen, la base teórica parte de una distribución de los datos, y_i ~ Poisson(mu_i), con la función link inversa para la media mu_i = exp(Xβ), y el vector de parámetros β ~ N(b ₀, B₀ ^-1). Luego de hacer el producto de la distribución a priori por la de los datos, se obtiene la distribución a posteriori, de la cual se establecen condicionales por cada parámetro, y con éstas se hace el muestreo MCMC. De este modo se obtienen estadísticas de los parámetros β para la función inversa: por ejemplo, la media y la mediana, y con cada una de éstas es posible escribir el modelo ajustado, pero es necesario transformar nuevamente la respuesta estimada con exp(Z) = mu_i en la escala original.

III. Resultados

Variables respuesta: Serie A: Turistas colombianos, Serie B: Turistas ex tranjeros. Periodo: años 2007 a 2014. N = 96, T = 72, periodos de pronós tico: 24 (2 años).

A. Análisis exploratorio

Es común medir la actividad económica por medio del PIB; no obstante, las cifras estadísticas oficiales pueden presentar un sesgo optimista sobre el crecimiento de la economía. Por tanto, se puede interpretar un indicador efec tivo como el IPC para que los agentes económicos de la industria del turismo en Colombia puedan establecer unas asociaciones posibles y, con ello, utilizar dichas relaciones en los procesos de toma de decisiones. Similarmente, la ac tividad económica asociada al consumo de energía puede servir, en general, para diagnosticar si las tendencias del turismo en Colombia se relacionan o no con dicho consumo, sin excluir el sector informal de la economía^⁴, estimando su efecto con los modelos que se presentan aquí.

Para alcanzar diagnósticos aceptables, se probaron diferentes variables utilizadas en la literatura, optando por explorar factores e índices que, por su naturaleza, guardan una relación estrecha con el dinamismo de la economía y, por supuesto, con el turismo. Tal es el caso de la cantidad de kilovatios hora de energía gastados en la ciudad en actividades económicas residencial, industrial y comercial para el mes respectivo, covariables que son usadas en la exploración de los modelos clásicos. Sin embargo, como se verá, no todas estas variables muestran asociaciones importantes con el flujo turístico.

Las series tienen tendencias lineales crecientes, con una variación que po dría ser cíclica (Gráfico 1). La característica de las variables discretas puede ocasionar que sea necesaria una transformación en los datos para inferir acer ca de su comportamiento; sin embargo, para efectos de comparar la capacidad predictiva del modelo regresivo normal con el bayesiano, no se realizará dicha transformación.

Gráﬁco 1 Series de tiempo: turistas colombianos, extranjeros, porcentaje de ocupación hotelera

La serie A (turistas colombianos) presenta autocorrelación estacional, tal como se aprecia en los valores de autocorrelaciones significativas saliendo de las bandas de confianza, en los periodos estacionales semestrales en el Gráfico 2. Similarmente ocurre para la serie B (turistas extranjeros). Las característi cas encontradas en las series temporales muestran la necesidad de incorporar componentes que modelen estacionalidad y correlación (como variables auto rregresivas), así como variables indicadoras (que toman valores 1 o 0) (como el mes del año) o trigonométricas (senuidal o cosenoidal), probando hasta en contrar las variables con mayor significancia en el modelo. Si bien las series evidentemente no son estacionarias, dado que los valores de autocorrelación de los periodos entre 1 y L son estadísticamente diferentes de cero (ver Grá fico 2), la estimación del modelo de regresión tiene grandes ventajas por la inclusión de covariables que permiten modelar los componentes estacionales, como variables indicadoras y variables rezagadas que capturan este tipo de comportamientos y correlación de la serie. De esta manera se pueden generar residuales incorrelacionados, como se demuestra con el análisis presentado.

Gráﬁco 2 Autocorrelación y autocorrelación parcial para las series de tiempo: turistas colombianos, extranjeros

Al realizar un análisis del comportamiento de variables, como IPC, y el gasto energético de actividades económicas, como residencial e industrial (ver Gráfico 3), se aprecia un aparente grado de disminución en el tiempo, lo que es contrario a las series de turistas que tienen tendencia a incrementarse.

Gráﬁco 3 Comportamiento de variables explicativas IPC, actividad económica residencial, actividad económica industrial

La exploración de los promedios de turistas por mes, que se observan en el Gráfico 4, refuerza el análisis de la incidencia de dicho factor sobre las series, pues se aprecia que en los meses de junio, julio, enero y diciembre es mayor el total de turistas colombianos, mientras que en los meses de julio, agosto y diciembre vienen más turistas extranjeros, ya que estos meses corresponden a las vacaciones de los países respectivos.

Gráﬁco 4 Medias de turistas colombianos y extranjeros por mes

B. Modelo lineal econométrico

Los modelos se estiman tomando en consideración la autocorrelación de tectada previamente, para ello se incluyen rezagos de la misma serie; para la estacionalidad detectada, se incluye el mes como variable indicadora. Estos modelos ayudan de manera exploratoria a detectar los efectos más signifi cativos en relación con las covariables mencionadas, y con éstas mismas se pueden ajustar los modelos bayesianos posteriormente.

La Tabla 1 muestra las tablas ANOVA tipo III estimadas para cada una de las series analizadas con los modelos de regresión.

Tabla 1 ANOVA tipo III para los dos modelos estimados

Fuente: elaboración propia.

En las tablas ANOVA se aprecia que todas las variables quedan signifi cativas para explicar la respuesta (valor p < 0, 05) en los respectivos mode los, luego del proceso de selección por pasos. Los coeficientes estimados se aprecian en la segunda columna de la Tabla 2. El rezago de orden 1 (Z_t−1) es significativo para explicar la cantidad de turistas, tanto colombianos co mo extranjeros, lo cual indica la dependencia con respecto al valor del mes anterior.

Tabla 2 Valores de los coeﬁcientes para los modelos estimados

Fuente: elaboración propia.

La Tabla 3 presenta los indicadores de ajuste para cada modelo estimado.

Tabla 3 Indicadores de error y validación de cada modelo

Fuente: elaboración propia.

La tabla 3 muestra, en la primera línea, los valores MAPE de ajuste para el modelo de regresión clásica. El menor valor de error MAPE se da en la serie de los turistas extranjeros, con 14 %, y los colombianos, con 15 %. La incorrelación en todos los residuales se cumple; es decir, los residuales tienen estacionariedad, pero no se comportan bajo la distribución normal, en los dos primeros modelos de las series de turistas (valor p< 0, 05). Los residuales no se comportan con dicha distribución porque existen puntos atípicos que lo implican, pero no deben eliminarse porque, de hecho, su información es muy valiosa para la estimación de estos modelos. Se hacen transformaciones de las variables respuesta como logaritmo natural, raíz cuadrada y potencia de Box Cox. Sin embargo, ninguna mejora el problema de no normalidad^⁵.

En el Gráfico 5 se aprecian los valores observados (en negro), el ajuste (en línea punteada) de los modelos finales econométricos estimados para las series de turistas colombianos y extranjeros, y los respectivos intervalos de confianza al 95 %, bajo la distribución normal (en gris). Aunque se aprecia la mayoría de valores reales (en negro) dentro de los intervalos quedan por fuera algunos un poco extremos.

Gráﬁco 5 Ajuste de modelos econométricos para las series de turistas colombianos y extranjeros

C. Modelos de regresión bayesiana

1) Regresión bayesiana basada en la distribución normal para los datos

Las variables explicativas que fueron encontradas significativas en el mo delo de regresión anterior, que reflejan el comportamiento que se visualizó en el análisis de autocorrelación, serán incluidas en estos modelos de regresión Bayesiana. En el primer modelo Bayesiano ajustado, se utiliza la fórmula con las covariables: rezago de orden 1, tiempo (tendencia), y como variable esta cional, el mes. En el Gráfico 6 se aprecia la línea de valores reales (en negro) vs valores ajustados (en línea punteada), para cada una de las series de tiempo de izquierda a derecha: turistas colombianos y extranjeros, con los respectivos intervalos del 95 % de probabilidad (en gris) de la distribución predictiva T de Student, con la cual se realizan los pronósticos.

Gráﬁco 6 Ajuste de los modelos de regresión bayesianos bajo la distribución normal para los datos Nota: Intervalos del 95 % (límites bilaterales, en los percentiles 2,5 % y 97,5 %).

El ajuste del modelo bayesiano visto en el Gráfico 6 se basa en el percentil 50 de la distribución predictiva T de Student del modelo con la cuarta ecuación de la Tabla 4. Se observa cómo el ajuste se acerca mucho a la línea de datos reales. Además, los intervalos son un poco más amplios que los del modelo clásico y contienen más valores reales que los intervalos de éste.

Se estimaron diferentes modelos de regresión bayesiana con la distribu ción no informativa explicada en la sección I.B. Se usaron los percentiles 25 %, 50 % y 75 % de la distribución predictiva para encontrar diferentes valores ajustados acorde con cada ecuación previamente establecida y así determinar el mejor valor posible. Se estiman tres indicadores, MAPE, sMAPE, RMSE, con todos los valores observados vs los estimados. Estos resultados se mues tran en la Tabla 4.

Tabla 4 Indicadores estimados por serie, percentil y modelo

Fuente: elaboración propia.

Los mínimos indicadores hallados son menores que los encontrados para el modelo de regresión econométrico de la Tabla 3, para los tres indicadores, siendo la cuarta la mejor ecuación de covariables: y _t−1, t, Sin, mes (tabla 4). Los datos señalados en cursiva para esta ecuación en cada serie son los mejores, los cuales corresponden a la mediana (50 %). Los tres indicadores coinciden en el resultado, lo cual muestra la efectividad que tienen para este tipo de valores tan altos en las series de tiempo.

2) Regresión bayesiana basada en la distribución Poisson para los datos

Tomando en cuenta los resultados de significancia determinados con los modelos de regresión para las series de turistas, se usaron las covariables fi nales de mayores efectos sobre la respuesta para estimar los modelos de re gresión Poisson bayesiana, vía MCMC, llegando a los siguientes resultados.

Los coeficientes se simulan de la distribución a posteriori, y la salida de R provee estadísticas de dichas muestras de cada coeficiente, como la media y diferentes percentiles. Con cada percentil es posible ajustar los valores de la regresión Poisson bayesiana. La Tabla 5 muestra la salida de R para la serie de datos de turistas colombianos, una tabla similar sale para la serie de turistas extranjeros, pero con las variables IPC y actividad económica industrial, como las variables encontradas para el modelo clásico. Con los valores de las medias y los percentiles 25 %, 50 % y 75 %, se pueden estimar 4 modelos por cada serie, cuyos indicadores de error MAPE, sMAPE y RMSE se muestran en la Tabla 6.

Tabla 5 Resultados de MCMC poisson para turistas colombianos

Fuente: elaboración propia.

En la Tabla 6 se aprecian indicadores más altos que los encontrados en los modelos anteriores. Sin embargo, no son valores muy malos en compara ción con la regresión bayesiana anterior, pero son mejores que los del modelo clásico. Lo anterior podría dejar este modelo como alternativa frente a otros casos de datos discretos que no tengan escalas muy altas para aproximar el modelo de regresión bayesiana bajo la escala normal.

Tabla 6 Indicadores de error de los modelos de la regresión Poisson bayesiana

Fuente: elaboración propia.

En el Gráfico 7, donde se aprecia el ajuste en línea punteada y límites de confianza en color gris, se observan un poco más datos por fuera de los inter valos estimados para este modelo vía MCMC, situación que en los anteriores modelos puede derivar en mayores errores al pronosticar.

Gráﬁco 7 Ajuste de los modelos Poisson bayesianos vía MCMC: turistas colombianos, extranjeros Nota: Intervalos al 95 % de la muestra de MCMC (Límites bilaterales, en los percentiles 2,5 % y 97,5%).

IV. Discusión

Es importante notar que la regresión Bayesiana, tanto el modelo baye siano basado en la aproximación normal de los datos como el basado en la distribución Poisson con muestreo por MCMC, puede proporcionar un re sultado adecuado para predecir demandas turísticas, en modelos con cova riables muy similares a las encontradas en la regresión clásica, con mejores indicadores de error de ajuste. Modelos que también pueden ser comparados con otros como los usados con distribución empírica, binomial negativa, de regresión Poisson con bootstrap, en (^{Kolasa, 2016}), o modelos dinámicos li neales, o incluso, con intervención de expertos, aspecto que incrementaría la información para realizar planeación de recursos y disponibilidades hoteleras por mes, mejorando las posibilidades de ingresos.

Conclusiones

Se encontraron modelos con adecuada representación de la variación tem poral de las series de turistas que llegan a Medellín, colombianos o extranje ros, diferentes a los modelos clásicos, basados en Estadística Bayesiana. Así mismo, se hallaron indicios de comportamientos estacionales, reflejados en la presencia de la variable indicadora mes, además, se encontró un impacto significativo del valor de turistas rezagado de orden 1, para explicar el com portamiento de la cantidad de ambos tipos de turistas que llegan a esta ciudad, es decir, tiene una dependencia temporal de primer orden. Esto permitió ca racterizar el comportamiento de este sector de la economía colombiana, y con ello, ayudar en la planeación de dicho sector.

Al usar los indicadores de errores sMAPE y RMSE -que son muy útiles en casos generales, en especial robustos cuando las respuestas se acercan a cero- se corrobora que el indicador MAPE puede ser apropiado, pero solo en casos en los que los datos toman valores muy altos, como se ve en este trabajo, alrededor de 5000 o más turistas por mes.

La variable mes también es una variable estadísticamente significativa en las demandas de turismo de colombianos y extranjeros, resultado que permite identificar los periodos de mayor incidencia para la planeación de recursos hoteleros. Por ejemplo, para los colombianos, las vacaciones entre diciembre-enero y junio-julio representan temporadas para visitar la ciudad de Medellín, y anualmente se repite dicho comportamiento.

Las asociaciones negativas, encontradas con los gastos energéticos, po drían deberse a diversas razones, una de ellas puede ser que los periodos de mayor flujo turístico son las vacaciones de los sectores educativos; sin em bargo, es necesario usar otro tipo de técnicas investigativas para determinar si hay algún grado de disminución de actividades o alguna otra razón.

Puede considerarse para futuros estudios la planeación de disponibilidad de hoteles en la ciudad, analizando la incidencia del mes, dados los resultados de éste estudio. Con ello, se puede requerir mayores recursos en los meses encontrados con mayor incidencia de los turistas extranjeros, como son: julio, agosto y diciembre, temporadas en que también se programan eventos de ciudad como la feria de las flores, en agosto, y los alumbrados, en diciembre. Por todo esto es importante programar estrategias de atención y cobertura de los servicios requeridos por este tipo de turistas.

Referencias

Agencia EFE (18 de septiempre de 2014). Informalidad del turismo en Colombia impide su crecimiento, según expertos. El Heraldo. Recupe rado de: http://www.elheraldo.co/turismo/informalidad-del-turismo-en colombia-impide-su-crecimiento-segun-expertos-167437 [ Links ]

Bes, Christian & Sethi, Suresh (1988). “Concepts of forecast and decision horizons: Applications to dynamic stochastic optimization problems”, Mathematics of Operations Research, Vol. 13, No. 2, pp. 295-310. [ Links ]

Bonilla, Jorge Mauricio & Moreno, María Margarita (2010). Determinan tes de la demanda de turismo en Colombia 2004-2007: seguridad, comercio y otros factores. Tesis de Pregrado para optar al título de Economista, Fa cultad de Economía, Universidad del Rosario, Colombia. [ Links ]

Bowerman, Bruce L.; Oconnell, Richard T. & Koheler, Anne B. (2007). Pronósticos, series de tiempo y regresión: un enfoque aplicado. México: Cen gage Learning Editores S.A. [ Links ]

Brown, Robert Goodell (1959). Statistical Forecasting for Inventory Control. New York: McGraw-Hill. [ Links ]

Brown, Robert Goodell (1963). Smoothing, Forecasting and Prediction of Dis crete Time Series. New Jersey: Prentice Hall, Englewood Cliﬀs. [ Links ]

Caridad y Ocerin, José María (1998). Econometria: Modelos Econométricos y series temporales. Barcelona: Editorial Reverté. [ Links ]

Cerda, Rosa & Leguizamón, Manuel (2005). “Análisis del comportamiento de la demanda turística urbana de Colombia”, Turismo y Sociedad, Vol. 4, pp. 70-98. [ Links ]

Chen, Kuan-Yu (2011). “Combining linear and nonlinear model in forecas ting tourism demand”, Expert Systems with Applications, Vol. 38, No. 8, pp. 10368-10376. [ Links ]

Choi, T.; Li, D. & Yan, H. (2003). “Optimal two-stage ordering policy with Bayesian information updating”, Journal of the Operational Research So ciety, Vol. 54, No. 8, pp. 846-859. [ Links ]

Claveria, Oscar & Torra, Salvador (2014). “Forecasting tourism demand to Catalonia: Neural networks vs. time series models”, Economic Modelling, Vol. 36, pp. 220-228. [ Links ]

Cohen, Rochelle & Dunford, Fraser (1986). “Forecasting for Inventory Control: An Example of When ‘Simple’ Means ‘Better”’, Interfaces, Vol. 16, No. 6, pp. 95-99. [ Links ]

Croston, J.D. (1972). “Forecasting and stock control for intermittent de mands”, Operational Research Quarterly, Vol. 42, No. 3, pp. 289-303. [ Links ]

Crouch, Goeﬀrey (1995). “A meta-analysis of tourism demand”, Annals of tourism research, Vol. 22, No. 1, pp. 103-118. [ Links ]

De Mol, Christine; Giannone, Domenico & Reichlin, Lucrezia (2008). “Forecasting using a large number of predictors: Is Bayesian shrinkage a valid alternative to principal components?”, Journal of Econometrics, Vol. 146, No. 2, pp. 318-328. [ Links ]

Fei, Xiang; Lu, Chung-Cheng & Liu, Ke (2011). “A bayesian dynamic linear model approach for real-time short-term freeway travel time prediction”, Transportation Research Part C:Emerging Technologies, Vol. 19, No. 6, pp. 1306-1318. [ Links ]

Galvis, Luis Armando & Aguilera, María Modesta (1999). “Determinantes de la demanda por turismo hacia Cartagena, 1987-1998”, Lecturas de Economía, No. 51, pp. 47-87. [ Links ]

Gelman, Andrew; Carlin, John; Stern, Hal & Rubin, Donald (2004). Ba yesian Data Analysis (2^nd Ed.). Boca Raton, FL: CRC Press, Taylor & Francis Group. [ Links ]

Gill, Jeﬀ (2007). Bayesian methods: A social and behavioral sciences approach (2^nd Ed.). United States of America: Chapman & Hall. [ Links ]

Guizzardi, Andrea & Mazzocchi, Mario (2010). “Tourism demand for Italy and the business cycle”, Tourism Management, Vol. 31, No. 3, pp. 367-377. [ Links ]

Guizzardi, Andrea & Stacchini, Annalisa (2015). “Real-time forecasting regional tourism with business sentiment surveys”, Tourism Management, Vol. 47, pp. 213-223. [ Links ]

Gutiérrez, Valentina & Vidal, Carlos (2008) “Modelos de gestión de in ventarios en cadenas de abastecimiento: Revisión de la literatura”, Revista Facultad de Ingenieria, Vol. 43, pp. 134-149. [ Links ]

Harrison, J. & Stevens, C. (1976). “Bayesian Forecasting”, Journal of the Royal Statistical Society. Series B (Methodological), Vol. 38, No. 3, pp. 205-247. [ Links ]

Hellström, Jörgen (2002). “Count data modelling and tourism demand”, Umeå Economic Studies, No. 584. Swedend: Umeå University. [ Links ]

Hillier, Frederik & Hillier, Mark (2007). Métodos cuantitativos para admi nistración (3th Ed). México D.F.: McGraw-Hill. [ Links ]

Kolasa, Stephan (2016). “Evaluating predictive count data distributions in retail sales forecasting”, International Journal of Forecasting, Vol. 32, No. 3, pp. 788-803. [ Links ]

Li, Gang; Song, Haiyan & Witt, Stephen (2005). “Recent developments in econometric modeling and forecasting”, Journal of Travel Research, Vol. 44, No. 1, pp. 82-99. [ Links ]

Lim, Christine (1999). “A meta-analytic review of international tourism de mand”, Journal of Travel Research, Vol. 37, No. 3, pp. 273-284. [ Links ]

Liu, Xiangyun; Peng, Hongqin; Bai, Yun; Zhu, Yujun & Liao, Lueling (2014). “Tourism Flows Prediction based on an Improved Grey GM(1,1) Model”, Procedia -Social and Behavioral Sciences, Vol. 138, pp. 767-775. [ Links ]

López, Ledys & Márquez, José Ignacio (2012). “Proyecto de observatorio de turismo para Medellín y Antioquia”, Revista Soluciones de Posgrado EIA, Vol. 5, No. 9, pp. 79-96. [ Links ]

Martin, Andrew; Quinn, Kevin & Park, Jong (2011). “MCMCpack: Mar kov Chain Monte Carlo in R.”, Journal of Statistical Software, Vol. 42, No. 9, pp. 1-21. [ Links ]

Neelamegham, Ramya & Chintagunta, Pradeep (1999). “A Bayesian mo del to forecast new product performance in domestic and international markets”, Marketing Science, Vol. 18, No. 2, pp. 115-136. [ Links ]

Peng, Bo; Song, Haiyan & Crouch, Geoﬀrey (2014). “A meta-analysis of international tourism demand forecasting and implications for practice”, Tourism Management, Vol. 45, pp. 181-193. [ Links ]

Petris, Giovanni; Petrone, Sonia & Campagnoli, Patrizia (2009). Dynamic Linear Models with R. New York: Springer. [ Links ]

Samaratunga, Chand; Sethi, Suresh & Zhou, Xun Yu (1997). “Compu tational evaluation of hierarchical production control policies for sto chastic manufacturing systems”, Operations Research, Vol. 45, No. 2, pp. 258-274. [ Links ]

Sarimveis, Haralambos; Patrinos, Panagiotis; Tarantilis, Chris & Kira noudis, Chris (2008). “Dynamic modeling and control of supply chain systems: A review”, Computers & Operations Research, Vol. 35, No. 11, pp. 3530-3561. [ Links ]

Shoesmith, G.L. & Pinder, J.P. (2001). “Potential Inventory Cost Reduc tions Using Advanced Time Series Forecasting Techniques”, Journal of the Operational Research Society, Vol. 52, No. 11, pp. 1267-1275. [ Links ]

Song, Haiyan & Li, Gang (2008). “Tourism demand modelling and forecasting-A review of recent research”, Tourism Management, Vol. 29, No. 2, pp. 203-220. [ Links ]

Song, Haiyan; Gao, Bastian Z. & Lin, Vera (2013). “Combining statistical and judgmental forecasts via a web-based tourism demand forecasting system”, International Journal of Forecasting, Vol. 29, No. 2, pp. 295-310. [ Links ]

Syntetos, Aris; Babai, M. Zied; Lengu, David & Altay, Nezih (2011). “Dis tributional assumptions for parametric forecasting of intermittent de mand”. In: Altay, Nezih & Litteral, Lewis (Eds.), Service Parts Manage ment. Demand Forecasting and Inventory Control (pp. 31-52). London: Springer. [ Links ]

Valencia, Marisol (2016). Dynamic model for the multiproduct inventory op timization with multivariate demand. Tesis para optar al título de: PhD en Ingeniería-Industria y organizaciones, Facultad de Minas, Escuela de Ingeniería de la Organización, Universidad Nacional de Colombia. [ Links ]

Vidal, Carlos; Londoño, Julio & Contreras, Fernando (2004) “Aplicación de Modelos de Inventarios en una Cadena de Abastecimiento de Produc tos de Consumo Masivo con una Bodega y N Puntos de Venta”, Ingenie ría y Competitividad, Vol. 6, No. 1, pp. 35-52. [ Links ]

Wallström, Peter & Segerstedt, Anders (2010). “Evaluation of forecasting error measurements and techniques for intermittent demand”, Interna tional Journal of Production Economics, Vol. 128, No. 2, pp. 625-636. [ Links ]

West, Mike & Harrison, Jeﬀ (1997). Bayesian Forecasting and Dynamic Models (2^nd Ed.). New York. USA. : Springer Series in Statistics. [ Links ]

Witt, Stephen & Witt, Christine (1995). “Forecasting tourism demand: A review of empirical research”, International Journal of Forecasting, Vol. 11, No. 3, pp. 447-475. [ Links ]

Zellner, Arnold (1996). An introduction to bayesian inference in econometrics (2^nd Ed.). Canadá: Wiley Classics Library. [ Links ]

Zhou, Ting; Bonham, Carl & Gangnes, Byron (2007). “Modelling the supply and demand for tourism: a fully identiﬁed VECM approach”, Working Papers, No. 2007-17. Department of Economics, University of Hawaii at Manoa. [ Links ]

¹Este artículo es un producto derivado del proyecto de investigación “Flujos turísticos en Colombia: perspectivas y determinantes”, proyecto financiado por la Fundación Universitaria Autónoma de las Américas.

²También, se destaca el trabajo de López y Márquez (2012), en el que formulan un observatorio para el análisis del turismo y presentan su organización; sin embargo, a nivel de pronósticos de demanda, son pocos los trabajos existentes.

³Modelos que han sido usados por autores como Brown (1959; 1963).

⁴Según el presidente ejecutivo de la Asociación Hotelera y Turística de Colombia (Cotelco), Gustavo Adolfo Toro, la informalidad alcanza un 30 % del gremio (Agencia EFE, 2014).

⁵Una razón que justifica aún más el uso del modelo bayesiano descrito y cuyo algoritmo en R se desarrolla y presenta en este artículo (Zellner, 1996), ya que los modelos propuestos no se restringen a este supuesto restrictivo sobre sus residuos.

Recibido: 22 de Julio de 2015; Aprobado: 06 de Febrero de 2016

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons

Services on Demand

Journal

Article

Indicators

Related links

Share

Lecturas de Economía

Print version ISSN 0120-2596

Lect. Econ. no.86 Medellín Jan./June 2017

https://doi.org/10.17533/udea.le.n86a08