SciELO - Scientific Electronic Library Online

 
 número44Distributed generation scheme analysis as an option for colombian electrical systemHeuristic rules for transforming preconceptual schemas into uml 2.0 diagrams: a C# implementation índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Em processo de indexaçãoCitado por Google
  • Não possue artigos similaresSimilares em SciELO
  • Em processo de indexaçãoSimilares em Google

Compartilhar


Revista Facultad de Ingeniería Universidad de Antioquia

versão impressa ISSN 0120-6230versão On-line ISSN 2422-2844

Rev.fac.ing.univ. Antioquia  n.44 Medellín abr./jun. 2008

 

Pronóstico del precio de la energía eléctrica usando redes neuronales artificiales

Electricity price forecasting using artificial neural networks

 

Fernando Villada* , Diego Raúl Cadavid, Juan David Molina

Grupo de Manejo Eficiente de la Energía - GIMEL, Universidad de Antioquia, A.A. 1226, Medellín, Colombia

 

 


Resumen

Este trabajo propone un modelo para el pronóstico del precio de la energía eléctrica en Colombia mediante el uso de redes neuronales artificiales. Se utilizan dos estructuras de redes incluyendo como entradas la serie de precios diarios en la primera y la serie de precios más el nivel medio de los embalses en la segunda. Los resultados se comparan con un modelo Autorregresivo Condicional Heterocedástico Generalizado (GARCH) encontrándose ventajas en este último dentro del período de muestreo, pero un mejor desempeño de las redes neuronales en el período fuera de la muestra. Los datos históricos se obtuvieron de la Compañía XM perteneciente al grupo ISA, de los cuales se usan 120 días para entrenamiento y los 31 días del mes siguiente para verificación del pronóstico.

Palabras Clave: Pronóstico, precios de la electricidad, redes neuronales, modelos de series de tiempo.


Abstract

A model for forecasting the electricity price in Colombia using artificial neural networks is proposed in this work. Two neural networks structures including the price series in the first and the price series plus the water reserve levels in the latter are used. The results are compared with a Generalized Autorregresive Conditional Heteroskedastic Model (GARCH) model, which shows better adjustment inside the training period, but the neural networks have better performance forecasting outside the training sample. Historical data was supplied by the Company XM belonging to ISA Group, where 120 days were used as training patterns and the next 31 days were left to test the next month forecast.

Keywords: Forecasting, electricity price, artificial neural networks, time series models.


 

Introducción

La industria eléctrica en muchas partes del mundo ha venido presentando grandes cambios tendientes a incentivar una mayor participación de agentes privados, con el objetivo de aumentar la eficiencia de la industria dentro de un esquema de libre mercado. Se pretende que el funcionamiento de los mercados energéticos, en lo posible, esté regulado por la dinámica de las fuerzas del mercado, esto es, que el precio de los bienes energéticos sea el resultado de la interacción de la oferta y la demanda.

Un elemento importante para los administradores de los mercados de la electricidad es el pronóstico de los precios en el corto, mediano y largo plazo. Decisiones sobre aumentos en la transmisión, expansión de la generación, planeación de la distribución e intercambios de electricidad entre regiones o países están determinadas por el pronóstico del precio de la electricidad en el largo plazo. Sin embargo, los niveles de transacciones entre los participantes del mercado dependen altamente del pronóstico del precio en el corto plazo. Varios autores han propuesto diferentes modelos de pronóstico del precio de la electricidad en el corto plazo (el día siguiente). Nogales [1] y Contreras [2] utilizan modelos de series de tiempo y modelos Autorregresivos e Integrados de Promedios Móviles (ARIMA), respectivamente para pronosticar el precio de la electricidad del día siguiente. Su aplicación a los mercados de California y de España mostró errores medios inferiores al 10%. Conejo [3] usa la transformada de Wavelet para descomponer la serie de datos aplicando luego modelos ARIMA a la serie transformada. Este preprocesamiento de la serie permite mejorar la precisión en los pronósticos con errores que oscilan entre el 5% y el 7%.

Un aspecto fundamental de los precios de la electricidad no contemplado en los trabajos anteriores es la existencia de una alta volatilidad, al menos durante ciertos períodos de tiempo. García [4] presenta un modelo GARCH (autorregresivo condicional heterocedástico generalizado) para pronosticar el precio de la electricidad un día después, el cual tiene en cuenta los cambios en la volatilidad debida a picos en los precios. Los resultados del modelo GARCH son similares a los modelos ARIMA en periodos de baja volatilidad pero mejoraron considerablemente para los días que presentaron picos grandes en el precio. Ante el comportamiento no lineal de este tipo de variables económicas, recientemente se han propuesto nuevos métodos basados en redes neuronales artificiales [5]. Su principal característica de permitir establecer relaciones lineales y no lineales entre las entradas y salidas de un sistema ha hecho posible mostrar su aplicabilidad en mercados de alta volatilidad, cuyas variables obedecen a comportamientos no lineales en diversas áreas de la ingeniería, el mercado de valores y el mercado de divisas [6].

Szkuta [7] entrenó una red neuronal multicapa para pronosticar el próximo precio de la electricidad en el mercado Australiano utilizando como entradas los datos de tres días anteriores en relación al precio, las reservas del sistema y la demanda potencial. Los resultados mostraron gran superioridad de las redes neuronales en comparación con las técnicas de regresión lineal convencionales utilizadas por la empresa. Radwan [8] propone una nueva estructura de red neuronal utilizando adicionalmente la información del clima con el fin de pronosticar la demanda en un plazo muy corto (desde una hora hasta un día), obteniendo errores medios del orden del 3%.

Los métodos para pronosticar el precio de ejercicio del mercado de la electricidad (market clearing price) son analizados por Amjady [9]. En este trabajo se compara la capacidad de pronóstico de los modelos ARIMA, GARCH y redes neuronales, llegando a proponer nuevos modelos de redes neuronales como estructuras en cascada o EKF (Extender Kalman filter) con el fin de mejorar el desempeño de la tradicional red de propagación.

En aplicaciones que buscan cubrir un margen de tiempo superior (1 a 3 meses), se tienen aplicaciones de las redes neuronales para el pronóstico de tasas de cambio y otras variables macroeconómicas. Nicokota [10] utilizó las redes neuronales para pronosticar la tasa de cambio entre el dólar canadiense y el dólar americano en el rango de 90 días. Para ello utilizó el historial de diez años como datos de entrenamiento, teniendo en cuenta el efecto de dos variables macroeconómicas (tasa de interés y precio del petróleo) y los flujos de órdenes de transacciones. Los resultados mostraron menor error en el pronóstico con redes neuronales en comparación con el modelo del paseo aleatorio y otros modelos lineales.

En este trabajo se pretende estudiar el comportamiento del precio de la energía eléctrica en un rango de tiempo superior a los trabajos referenciados. Se propone un modelo basado en redes neuronales artificiales y se evalúa su desempeño en el pronóstico de un mes completo para el mercado eléctrico colombiano. Se utilizan dos estructuras de redes incluyendo como entradas la serie de precios diarios en la primera y la serie de precios más el nivel medio de los embalses en la segunda. Los resultados obtenidos se comparan con el pronóstico basado en un modelo GARCH encontrándose ventajas en este último dentro del período de muestreo, pero un mejor desempeño de las redes neuronales en el período fuera de la muestra.

 

Redes neuronales artificiales

Una red neuronal es un sistema que permite establecer una relación lineal o no lineal entre las salidas y las entradas. Sus características están inspiradas en el sistema nervioso lo que les da varias ventajas, tales como su capacidad de aprendizaje adaptativo, son auto-organizativas, pueden funcionar en paralelo en tiempo real y ofrecen tolerancia a fallos por la codificación redundante de la información. Desde el punto de vista de solución de problemas, las redes neuronales son diferentes de los computadores convencionales que usan algoritmos secuenciales, mientras que las redes neuronales actúan como el cerebro humano, procesando la información en paralelo, y también pueden aprender y generalizar a situaciones no incluidas en el proceso de entrenamiento. Las redes neuronales pueden procesar información de forma más rápida que los computadores convencionales, pero tienen la desventaja de que no podemos seguir su respuesta paso a paso como se puede hacer al ejecutar un programa convencional en un ordenador, por lo que no resulta fácil detectar los errores. Las redes neuronales artificiales son muy efectivas para resolver problemas complicados de clasificación y reconocimiento de patrones. La más utilizada es la llamada de propagación hacia delante. La figura 1 muestra una red de propagación hacia delante con dos capas ocultas. El número de entradas es directamente dependiente de la información disponible para clasificar mientras que el número de neuronas de salida es igual al número de clases a separar. Las unidades de una capa se conectan unidireccionalmente con las de la siguiente, en general todas con todas, sometiendo sus salidas a la multiplicación por un peso que es diferente para cada una de las conexiones.

Figura 1 Red neuronal de propagación hacia adelante

Las Redes Neuronales Artificiales se han empleado para resolver numerosos problemas. Entre estos, los económicos y financieros, destacando en gran medida su aplicación en la predicción de series temporales y su capacidad para detectar y explotar la no-linealidad existente en los datos, aun en condiciones donde existen datos incompletos o la presencia de ruido; también se destacan por su desempeño en la solución de problemas complejos, donde el reconocimiento de modelos o comportamientos es importante.

 

Aplicación de las redes neuronales al pronóstico de precios de la energía eléctrica

Uno de los aspectos fundamentales cuando se va a enfrentar un proyecto con redes neuronales es disponer de una base de datos histórica de la variable, lo suficientemente grande, para garantizar que el proceso de entrenamiento sea mucho más confiable. Como se anotó anteriormente los históricos correspondientes al precio diario del kilovatio- hora en pesos colombianos y el nivel diario de los embalses se obtuvieron de XM, Compañía de Expertos en Mercados S.A., perteneciente al grupo ISA. La red que se utilizó fue el perceptrón multicapa con conexiones hacia adelante, porque dentro del marco de las redes de neuronas, el perceptrón ha mostrado ser una de las arquitecturas más útiles en la resolución de este tipo de problemas. Esto se debe, fundamentalmente, a su capacidad como aproximador universal. La arquitectura de esta red, se caracteriza porque tiene sus neuronas agrupadas en capas de diferentes niveles. Cada una de las capas está formada por un conjunto de neuronas y se distinguen tres tipos de capas diferentes: la capa de entrada, la capa de salida y las capas ocultas.

 

Algoritmo de Aprendizaje

La regla o algoritmo de aprendizaje es el mecanismo mediante el cual se van adaptando y modificando todos los parámetros de la red. En el caso del perceptrón multicapa se trata de un algoritmo de aprendizaje supervisado; es decir, la modificación de los parámetros se realiza para que la salida de la red sea lo más próxima posible a la salida proporcionada por el supervisor o salida deseada. Por tanto, el proceso de aprendizaje de la red es equivalente a encontrar un mínimo de la función error. El algoritmo de aprendizaje utilizado fue del tipo Levenberg Marquardt porque en general ha mostrado tener una convergencia más rápida, es decir, requiere menor cantidad de iteraciones para llegar al nivel de error especificado.

 

Proceso de Aprendizaje

El objetivo del aprendizaje o entrenamiento de la red, es ajustar los parámetros de la red, pesos y umbrales, con el fin de que las entradas presentadas produzcan las salidas deseadas, es decir con el fin de minimizar la función de error.

En lo que respecta al número de capas y neuronas por capa, no existe un método o regla que determine el número óptimo de neuronas ocultas para resolver un problema dado, generalmente se determinan por prueba y error, es decir partiendo de una arquitectura ya entrenada, se realizan cambios aumentando y disminuyendo el número de neuronas ocultas y el número de capas hasta conseguir la arquitectura que se ajuste a la solución del problema. La selección de la mejor estructura en este trabajo se determinó por medio de las medidas tradicionales de evaluación del pronóstico dentro y fuera de la muestra, que se describen en la siguiente sección.

 

Modelo de pronóstico con redes neuronales

En este trabajo se probaron diferentes estructuras de redes neuronales con una capa oculta, partiendo de un número de neuronas igual al promedio entre el número de entradas y el número de salidas. Luego se incrementó gradualmente el número de neuronas en dicha capa hasta obtener la estructura más recomendable para el pronóstico del precio de la energía eléctrica. La selección de la mejor estructura de red, se realiza considerando las siguientes medidas de evaluación dentro y fuera de la muestra: RMSE (Raíz del error medio cuadrático), RMSPE (Raíz del error medio cuadrático porcentual), MAE (Error medio absoluto) y el MAPE (Error medio absoluto porcentual) [11]. En la tabla 1 se presentan los resultados de las medidas de evaluación dentro y fuera de la muestra de las diferentes estructuras de red entrenadas para el modelo que considera una sola variable de entrada, donde r corresponde al número de rezagos considerados y n el número de neuronas en la capa oculta. De un conjunto total de 150 datos diarios se tomaron 119 para entrenamiento (aproximadamente 80%) y se dejaron 31 datos correspondientes a un mes completo para pronóstico fuera de la muestra.

El análisis de los resultados de la tabla 1 nos muestra que los errores dentro de la muestra son menores para la red neuronal con cuatro rezagos de tiempo; sin embargo, fuera de la muestra los resultados son mejores con la red de tres rezagos. Como nuestro objetivo es ante todo pronosticar por fuera de la muestra, se concluye que la red con mejor desempeño global contiene tres rezagos de tiempo y cuatro neuronas en su capa oculta. En la figura 2 se comparan los resultados de la red seleccionada con los datos reales en el período dentro de la muestra. La figura 3 muestra la capacidad de pronóstico al utilizar los resultados de la red para proyectar el precio de la energía eléctrica por un mes (31 datos diarios) después del período de entrenamiento. En ambas gráficas se observa una correspondencia aceptable del modelo de red neuronal con los datos reales.

Tabla 1 Desempeño de las redes neuronales entrenadas

Adicionalmente se estudió un segundo modelo que incluye dos variables de entrada: el precio diario de la energía eléctrica en pesos colombianos por kilovatio-hora y el nivel medio de los embalses. La tabla 2 presenta los resultados de las medidas de evaluación para el mismo período de tiempo analizado en la red anterior, donde se aprecia una mejoría en los resultados anteriores y un mejor desempeño de la red con cuatro rezagos de tiempo y cinco neuronas en la capa oculta tanto dentro como fuera del período muestral. En la figura 4 se comparan los resultados de la red seleccionada con los datos reales en el período dentro de la muestra y la figura 5 muestra la capacidad de pronóstico al utilizar los resultados de la red para proyectar el precio de la energía eléctrica por un mes (31 días) después del período de entrenamiento. En ambas gráficas se observa muy buena correspondencia del modelo de red neuronal con los datos reales.

Figura 2 Respuesta de la red neuronal con una variable de entrada y tres retardos de tiempo para datos dentro de la muestra

Figura 3 Pronóstico dentro y fuera de la muestra de la red neuronal con tres retardos y una variable de entrada

Figura 4 Respuesta de la red neuronal con dos variables de entrada y cuatro retardos de tiempo para datos dentro de la muestra

Figura 5 Pronóstico dentro y fuera de la muestra de la red neuronal con cuatro retardos y dos variables de entrada

Tabla 2 Desempeño de las redes neuronales con dos variables de entrada

 

 

Análisis de resultados

Los resultados obtenidos con redes neuronales se comparan con los generados por un modelo autorregresivo condicional heterocedástico generalizado de orden 1 - GARCH(1,1) - debido a la volatilidad de la serie de precios diarios de la energía eléctrica, la cual de forma similar a la mayoría de las series de tiempo financieras, presenta la particularidad de que grandes cambios en el precio alternan con períodos en los cuales los precios difícilmente cambian. En la tabla 3 se comparan los resultados del modelo GARCH con tres estructuras de redes neuronales. Las primeras dos redes neuronales incluían solamente como entrada la serie de precios diarios de la energía, mientras que la tercera red incluye adicionalmente la serie de nivel medio de los embalses. Al analizar los modelos que incluyen solamente la serie de precios, se observa un mejor desempeño del modelo GARCH dentro de la muestra al compararlo con las dos primeras redes neuronales; sin embargo, las dos redes ofrecen un mejor desempeño fuera de la muestra. En forma general, la red neuronal 3 que manejaba adicionalmente la información de los embalses mostró un desempeño superior tanto dentro como fuera de la muestra.

Tabla 3 Comparación de resultados entre un modelo GARCH y las redes neuronales artificiales

 

 

Conclusiones

En este trabajo se propone un modelo para el pronóstico del precio de la energía eléctrica en Colombia mediante el uso de redes neuronales artificiales. Se utilizan dos estructuras de redes incluyendo como entradas la serie de precios diarios en la primera y la serie de precios más el nivel medio de los embalses en la segunda. Se destaca que los modelos basados en redes neuronales son en general más fáciles de implementar; muestran además un buen desempeño, presentando bajos errores y poca variación de los errores, aún en los casos donde se cambió el número de rezagos, el número de neuronas en la capa oculta y se adicionó una nueva variable de entrada. A pesar de que el modelo GARCH para el caso univariable mostró mejor ajuste dentro de la muestra, requiere de un experto que determine el procedimiento a seguir dependiendo del tipo de datos. Estos datos deben ser estacionarios, se deben analizar los gráficos de correlación, adecuar los modelos y medir los errores. El modelo basado en redes neuronales artificiales es más sencillo de implementar y en todos los casos mostró mejor desempeño en el pronóstico fuera de la muestra. La red neuronal ampliada con dos variables de entrada superó también al modelo GARCH en el ajuste dentro de la muestra.

 

Referencias

1. F. J. Nogales, J. Contreras, A. Conejo, R. Espínola. 'Forecasting next-day electricity prices by time series models'. IEEE Transactions on Power System. Vol. 17. 2002. pp. 342 - 348.        [ Links ]

2. J. Contreras, R. Espínola, F. J. Nogales, A. Conejo. 'ARIMA models to predict next-day electricity prices'. IEEE Transactions on Power Systems. Vol. 18. 2003. pp. 1014 - 1020.        [ Links ]

3. A. Conejo, M. A. Plazas, R. Espínola, A. B. Molina. 'Day-ahead electricity price forecasting using the Wavelet transform and ARIMA models'. IEEE Transactions on Power Systems. Vol. 20. 2005. pp. 1035 - 1042.        [ Links ]

4. R. C. García, J. Contreras, M. V. Akkeren, J. B. C. García. 'A GARCH forecasting model to predict dayahead electricity prices'. IEEE Transactions on Power Systems. Vol. 20. 2005.pp. 867 - 874.        [ Links ]

5. S. Haykin. Neural networks a comprehensive foundation. New York. Macmillan College Publishing Company.1994. 1ª ed. pp. 18 - 41.        [ Links ]

6. F. Villada, W. Muñoz, A. Henao. 'Pronóstico de las tasas de cambio. Una aplicación al Yen Japonés mediante redes neuronales artificiales'. Revista Scientia et Technica. Vol 12. 2006. pp. 233 - 238.        [ Links ]

7. B. R. Szkuta, L. A. Sanabria, T. S. Dillon. 'Electricity price short-term forecasting using artificial neural networks'. IEEE Transactions on Power Systems. Vol. 14. 1999. pp. 851 - 857.        [ Links ]

8. E. Radwan. 'Short term hourly load forecasting using abductive networks'. IEEE Transactions on Power Systems. Vol. 19. 2004. pp. 164 - 173.        [ Links ]

9. N. Amjady, M. Hemmati. 'Energy price forecasting - problems and proposals for such predictions'. IEEE Power and Energy Magazine. Vol. 4. 2006. pp. 20 - 29.        [ Links ]

10. N. Gradojevic, J. Yang. The application of artificial neural networks to exchange rate forecasting: the role of market microstructure variables. Bank of Canada, Working paper 2000-23. 2000. pp. 10 - 27.        [ Links ]

11. P. H. Franses, D. V. Dijk. Non-linear time series models in empirical finance. Cambridge University Press. 2000. pp. 222 - 233.        [ Links ]

(Recibido el 3 de octubre de 2007. Aceptado el 29 de enero de 2008)

* Autor de correspondencia: Teléfono: + 57 + 4 + 219 55 58, fax: + 57 + 4 + 211 05 07, correo electrónico: fvillada@udea.edu.co (F. Villada).

 

Creative Commons License Todo o conteúdo deste periódico, exceto onde está identificado, está licenciado sob uma Licença Creative Commons