Multi-criteria methodology based on data science for the selection of the optimal forecast model for residential electricity consumption

Abstract

There is a wide variety of techniques and models for forecasting electrical energy consumption, depending on both the type of user, the forecast horizon, and the resolution of the available data. Likewise, there are different metrics to evaluate the performance of these models. So, in this research an integrated multi-criteria methodology is proposed to select the best forecast model for residential electricity consumption, using the Analytical Hierarchical Process (AHP) to establish the weights of relative importance of the decision criteria, and the Technique for Order of Preference by Similarity to Ideal Solution (TOPSIS) to make the selection of the optimal model. The methodology is in turn framed within a data science process, through which the data is extracted, processed, and analyzed, prior to the application of the machine learning algorithms to obtain the forecast models, which will correspond to decision alternatives. The performance metrics in the evaluation phase of the models, and the performance metrics obtained from the forecast phase, are considered as the decision criteria. From the pairwise comparisons technique, it was obtained that the mean absolute percentage error (MAPE) of the prognosis phase was the criterion with the greatest weight of importance, followed by the coefficient of determination R2 and the MAPE of the evaluation phase. From the TOPSIS method, the Multiple Linear Regression model was selected as the optimal forecast model.  Existe una gran variedad de técnicas y modelos para el pronóstico del consumo de energía eléctrica, dependiendo tanto del tipo de usuario, como del horizonte de pronóstico y de la resolución de los datos disponibles. Asimismo, existen distintas métricas para evaluar el desempeño de estos modelos. Entonces, en esta investigación se propone una metodología integrada multicriterio para seleccionar el mejor modelo de pronóstico del consumo de energía eléctrica residencial, utilizando el proceso jerárquico analítico (AHP) para establecer los pesos de importancia relativa de los criterios de decisión, y la técnica para el orden de preferencia por similitud con la solución ideal  (TOPSIS) para hacer la selección del modelo óptimo. La metodología se enmarca a su vez dentro de un proceso de ciencia de datos, a través del cual se extraen, procesan y analizan los datos, previo a la aplicación de los algoritmos de aprendizaje automático para obtener los modelos de pronósticos, que se corresponderán con las alternativas de decisión. Las métricas de desempeño en la fase de evaluación de los modelos, y las métricas de desempeño obtenidas de la fase de pronóstico, son consideradas como los criterios de decisión. De la técnica de comparaciones pareadas se obtuvo que el error porcentual absoluto medio (MAPE) de la fase de pronóstico fue el criterio con mayor peso de importancia, seguido del coeficiente de determinación R2 y del MAPE de la fase de evaluación. A partir del método TOPSIS, se seleccionó el modelo de Regresión Lineal Múltiple como el modelo óptimo de pronóstico

    Similar works