Centralized solar PV generation forecast from the perspective of a distribution system operator

Abstract

Tese de mestrado integrado, Engenharia da Energia e do Ambiente, Universidade de Lisboa, Faculdade de Ciências, 2018It is essential to have mechanisms to promote the integration of electricity from renewable energy sources in the power system from a technical, economic and social perspectives. Due to the stochastic nature of photovoltaic generation, good forecasts of future generation help grid operators and individual producers to better manage their operations, thus increasing the PV efficiency and competitiveness. This dissertation describes the development of a Random Forests forecasting algorithm for electricity generation of a photovoltaic power-plant from the perspective of Distribution System Operator. The model developed has the final aim to be a tool as support for grid management. The forecasting techniques chosen were Persistence and Random Forests. The inputs include a 3x3 matrix of weather forecasts, performed by a Numeric Weather Prediction model (centered on the location of the power-plant) astronomical and time variables. Two models were created: a Day-ahead model and an Intraday model. The Day-ahead model performs an hourly forecast early in the day using data from the previous day, while the Intraday is updated during the day, including photovoltaic generation data to correct the forecast made earlier by the Day-ahead model. Both models produce forecasts from 08:00 h to 18:00 h. They were tested with data for a location in Portugal with data from 2014. Several tests were carried out with different combinations of inputs in order to arrive at the combination of inputs that had a smaller prediction error (). The optimal combination, for both models, includes all Numeric Weather Prediction variables, the average of the photovoltaic generation from the two days before and astronomical and time variables. The for this test is 9.22% and 7.68%, for the Day-ahead and Intraday models, respectively. The Intraday model proved to be more accurate than the Day-ahead model and both performed accurate forecasts in clear days and were less accurate in irregular days.Com o aumento da utilização das energias renováveis, é essencial ter mecanismos para ajudá-las a serem aceites social e tecnicamente. Um dos mecanismos que recentemente começou a ser utilizado é a previsão de geração renovável, nomeadamente da eólica e, neste caso, a fotovoltaica. Devido à natureza estocástica da geração fotovoltaica, ter uma boa previsão da geração futura ajuda os operadores da rede e os produtores individuais a gerir melhor as suas operações, aumentando assim a eficiência e a competitividade. Esta tese consiste em criar um algoritmo com a utilização de modelos de aprendizagem inteligente, na linguagem de programação R, para prever a geração de uma central fotovoltaica, na perspetiva do Operador de Distribuição. O modelo desenvolvido tem o objetivo final de ser uma ferramenta como suporte para a gestão da grade. Existem vários tipos de modelos de previsão, os quais: modelo de persistência, modelos físicos (sendo o mais conhecido denominado de Previsão Numérica do Tempo), modelos estatísticos (que se dividem em métodos regressivos e modelos de aprendizagem inteligente), e modelos híbridos (que se dividem em modelos híbridos estatísticos e modelos híbridos físicos). Sendo um dos objetivos desta tese a utilização de modelos de aprendizagem inteligente, teve-se em conta os seguintes modelos: redes neuronais, k-vizinhos mais próximos, máquinas de vetor suporte e florestas aleatórias. Após a avaliação de cada um, o modelo de florestas aleatórias foi o escolhido para desenvolver as previsões de geração fotovoltaica. As florestas aleatórias é um modelo que se baseia em árvores de decisão. Este tem como método o desenvolvimento de um grande número de árvores, todas elas independentes entre si, elaborar uma previsão com base no resultado de todas as unidades. Para além disso, as florestas aleatórias são ainda um modelo recente na previsão de geração fotovoltaica, pelo que é interessante avaliar o modelo e aprofunda-lo. Para além deste modelo, também foi escolhido o modelo de persistência. Este assume que a geração fotovoltaica na unidade de tempo é igual à geração em +1, sendo por isso o modelo de previsão mais simples e utilizado como linha de base quando comparado com outros modelos de previsão mais complexos. Os dados utilizados como entrada no modelo desenvolvido foram: dados históricos de prodição da central fotovoltaica em estudo, previsões meteorológicas, numa matriz 3x3 centrada na localização da central fotovoltaica, cedidas pelo Instituto Português do Mar e da Atmosfera (feitas através do modelo físico Previsão Numérica do Tempo), variáveis astronómicas, dia juliano e hora solar; todos eles relativos aos anos 2013 e 2014. As previsões meteorológicas consistem nas variáveis: velocidade do vento, direção do vento, radiação, temperatura, pressão, componente u e v do vento. Para avaliar a precisão da previsão, recorreu-se ao calculo do erro da previsão, que visa comparar a previsão dada pelo modelo e produção fotovoltaica real. Para isso utilizou-se o erro quadrado médio. Foi também calculado um modelo de céu limpo com o objetivo de auxiliar as previsões, na vertente de produção e de irradiação. Com esse modelo foi calculado o índice de céu limpo também para ambas as vertentes. Para tornar o modelo mais versátil e adequado às necessidades do Operador de Distribuição, foram criados dois modelos: um modelo Dia-seguinte e um modelo Intradiário. O modelo Dia-seguinte consiste numa previsão horária no início do dia e é a primeira visão geral quanto ao perfil de geração que a central fotovoltaica terá nesse dia. Em primeiro lugar calculou-se o valor da previsão, para 2014, através do modelo de persistência de duas formas: uma fazendo a média do valor da produção dos dois últimos dias à hora em que se quer prever e assumir que essa será a produção do dia seguinte e outra fazendo o mesmo procedimento, mas com o valor do índice de céu limpo. De seguida, o modelo de árvores aleatórias foi desenvolvido. Neste caso, utilizou-se os dados referentes a 2013 para treinar e validar o modelo e os de 2014 para testa-lo. As entradas do modelo variaram entre várias combinações dos dados acima referidos. Foram feitas várias análises com o objetivo de encontrar a combinação de dados que resultasse no menor erro de previsão, entre elas: avaliação das variáveis meteorológicas, astronómicas e de tempo; avaliação da importância das variáveis meteorológicas relativas ao vento, inclusão de previsões meteorológicas elaboradas um e dois dias anteriores, interpolação linear das variáveis, inclusão de dados meteorológicos de pontos vizinhos e inclusão de dados de produção passada. O erro de previsão da persistência foi superior à maioria dos testes elaborados pelas florestas aleatórias, com a exceção do teste que incluiu todas as variáveis meteorológicas com as astronómicas e as de tempo mais dados de produção passada produziu o melhor resultado. Os respetivos erros foram de 9.92% e 9.22%. Por outro lado, o modelo Intradiário tem o objetivo de ser realizado ao longo do dia, incluindo a última geração de PV para corrigir a previsão feita pelo modelo Dia-seguinte. Neste caso, o modelo de persistência foi o primeiro a ser calculado. Assumiu-se que o valor da produção fotovoltaica e do índice de céu limpo da hora anterior seria igual à hora seguinte. Quanto ao modelo de árvores aleatórias, teve-se em conta o melhor resultado do modelo Dia-seguinte, ou seja, manteve-se as mesmas variáveis de entrada e adicionou-se a geração fotovoltaica da hora anterior. Neste caso, o erro de previsão da persistência foi superior ao erro gerado pelo teste das florestas aleatórias. Sendo que o erro da persistência foi de 10.40% e o erro do modelo Intradiário de florestas aleatórias foi de 7.68%. Posto isto, conclui-se que o modelo Intradiário mostrou ser mais preciso do que o modelo Dia-seguinte. Por sim, foram escolhidos quatro dias do ano de 2014, um para cada estação do ano: outono, inverno, primavera e verão. Observou-se que em geral o modelo Intradiário seguiu o perfil da geração fotovoltaica real com um maior rigor que o Dia-seguinte, o que cumpre com as espectativas e com o objetivo inicial de o modelo Intradiário ser um ajuste ao longo do dia do modelo Dia-seguinte. Aferiu-se também que ambos os modelos são mais precisos em dias limpos e pouco irregulares. Quanto a dias com nuvens e irregulares, os modelos têm mais dificuldade em prever o dia ou a hora seguintes. Este trabalho demonstra que é possível elaborar previsões de produção fotovoltaica com base em previsões meteorológicas, dados passados de produção e variáveis facilmente calculáveis como a hora solar, o dia juliano, o azimute e a altura solar. Num futuro muito próximo será imprescindível para operadores da rede o acesso a modelos de previsão. A previsão de produção será tão necessária para esses agentes como a previsão meteorológica é para a comunidade em geral

    Similar works