Desde hace años, las energías renovables están consideradas como una alternativa a las energías
tradicionales y están ganando cada vez más importancia a causa del calentamiento global. Uno de
los tipos de energía renovable más destacados es la energía solar, que se obtiene a partir de la
radiación electromagnética procedente del sol y que cada año aporta a la Tierra la energía
equivalente a varios miles de veces la cantidad de energía que consume el ser humano. El principal
problema de la energía solar es que es un recurso intermitente y no determinista, por lo que es
necesario que se pueda predecir cuándo se van a producir situaciones que puedan disminuir la
radiación solar. El desarrollo de sistemas de predicción de radiación solar ayudaría a incrementar
el número de centrales de energía renovable.
El objetivo de este proyecto es estudiar cuáles son las mejores técnicas de predicción para la
producción de energía solar. Para ello, hemos utilizado los datos de una competición celebrada en
2013 en la plataforma Kaggle. El objetivo de la competición era descubrir qué técnicas de
aprendizaje proporcionan las mejores predicciones a corto plazo de la energía solar total diaria
acumulada en 98 estaciones de la Mesonet de Oklahoma, utilizando datos meteorológicos recogidos por
el NOAA/ESRL Global Ensemble Forecast System (GEFS) entre 1994 y 2009.
Los métodos de predicción de datos con los que hemos abordado este problema son el Modelo de
Regresión Lineal, las Máquinas de Vectores de Soporte y Gradient Boosted Regression. Con estas tres
técnicas hemos realizado un total de seis experimento diferentes. En cada experimento, hemos
elegido un método de predicción a utilizar, hemos hecho una selección de los parámetros de dicho
método, hemos realizado un estudio de parámetros con el que hemos ajustado el valor de cada
parámetro, y hemos creado y entrenado diferentes modelos con los que posteriormente hemos realizado
predicciones de la energía solar diaria acumulada en cada estación. Para implementar todo esto,
hemos utilizado el lenguaje de programación R.
Una vez finalizados los experimentos y recopilados los resultados de todos ellos, los hemos
analizado y comparado para poder determinar cuál de las técnicas que hemos estudiado es la más
apropiada para abordar el problema de las
predicciones de acumulación de energía solar a corto plazo.For years, renewable energies have been considered an alternative to traditional energy sources
and their importance is increasing due to global warming. One of the most prominent types of
renewable energy is solar energy, that is obtained from the electromagnetic radiation from the sun
and that every year brings to Earth the energy equivalent to several thousand times the amount of
energy consumed by human being. The main problem is that solar energy is an intermittent and
non-deterministic resource, so it is neccesary to be able to predict when it is going to happen a
situation that can reduce solar radiation. The development of sunlight prediction systems would
help to increase the number of renewable energy plants.
The objective of this project is study which are the best prediction techniques for the production
of solar energy. To do this, we used the data from a competition held in 2013 in the Kaggle
platform. The aim of the competition was to discover which learning techniques provide the best
short-term predictions of total daily solar energy accumulated in 98 stations of the Oklahoma
Mesonet, using meteorological data collected by the NOAA / ESRL Global Ensemble Forecast System
(GEFS) between 1994 and 2009.
The data prediction methods we used to address this problem are Linear Regression Model, Support
Vector Machines and Gradient Boosted Regression. With these three techniques we have accomplished
a total of six different experiments. In each experiment, we chose a prediction method to use, we
have made a selection of the parameters for this method, we conducted a study of parameters with
which we have adjusted the value of each parameter, and we have created and trained different
models that we used later to make predictions of daily solar energy accumulated in each station. To
implement this, we used the R programming language.
After completing the experiments and compiled the results of all of them, we have analyzed and
compared them in order to determine which of the techniques we have studied is the most appropriate
technique to address the
problem of short-term predictions of solar energy accumulation.Grado en Ingeniería Informátic