    Definition of MV Load Diagrams via Weighted Evidence Accumulation Clustering using Subsampling

    A definition of medium voltage (MV) load diagrams was made, based on the data base knowledge discovery process. Clustering techniques were used as support for the agents of the electric power retail markets to obtain specific knowledge of their customers’ consumption habits. Each customer class resulting from the clustering operation is represented by its load diagram. The Two-step clustering algorithm and the WEACS approach based on evidence accumulation (EAC) were applied to an electricity consumption data from a utility client’s database in order to form the customer’s classes and to find a set of representative consumption patterns. The WEACS approach is a clustering ensemble combination approach that uses subsampling and that weights differently the partitions in the co-association matrix. As a complementary step to the WEACS approach, all the final data partitions produced by the different variations of the method are combined and the Ward Link algorithm is used to obtain the final data partition. Experiment results showed that WEACS approach led to better accuracy than many other clustering approaches. In this paper the WEACS approach separates better the customer’s population than Two-step clustering algorithm

    Determination of electricity consumers’ load profiles via weighted evidence accumulation clustering using subsampling

    With the electricity market liberalization, the distribution and retail companies are looking for better market strategies based on adequate information upon the consumption patterns of its electricity consumers. A fair insight on the consumers’ behavior will permit the definition of specific contract aspects based on the different consumption patterns. In order to form the different consumers’ classes, and find a set of representative consumption patterns we use electricity consumption data from a utility client’s database and two approaches: Two-step clustering algorithm and the WEACS approach based on evidence accumulation (EAC) for combining partitions in a clustering ensemble. While EAC uses a voting mechanism to produce a co-association matrix based on the pairwise associations obtained from N partitions and where each partition has equal weight in the combination process, the WEACS approach uses subsampling and weights differently the partitions. As a complementary step to the WEACS approach, we combine the partitions obtained in the WEACS approach with the ALL clustering ensemble construction method and we use the Ward Link algorithm to obtain the final data partition. The characterization of the obtained consumers’ clusters was performed using the C5.0 classification algorithm. Experiment results showed that the WEACS approach leads to better results than many other clustering approaches

    Previsão de curto prazo do consumo de energia

    Dissertação de Mestrado Integrado em Engenharia da Energia e do AmbienteRESUMO: O combate às alterações climáticas, bem como a redução da dependência energética externa passam pela instalação e exploração em larga escala de novas fontes energética renováveis, endógenas e não poluentes. Contudo, a introdução destas fontes no sistema electroprodutor (SE), com caráter estocástico, confere um nível de incerteza adicional no equilíbrio do mesmo. Neste equilíbrio, é fulcral atuar não só no lado da geração, mas igualmente no lado da procura, em oposição à perspetiva tradicional da gestão dos SEs, em que predomina o paradigma que a oferta deve estar sempre preparada para seguir o consumo, i.e., satisfazer totalmente, a procura, cujo comportamento é, tipicamente, considerado incontrolável e inelástico. Uma das formas mais consensuais para permitir esta mudança, assenta no conceito de gestão do consumo (Demand Side Management), que tem por objetivo flexibilizar o consumo, de modo a que este se adapte a uma produção variável no tempo ou em situações de constrangimento ou de estímulos tarifários. No entanto é necessário ter uma boa previsão do mesmo, de forma a solicitar atempadamente esta resposta do lado do consumo. Com a necessidade de previsões fidedignas como pano de fundo, na presente dissertação é proposta a implementação e comparação de vários modelos, de previsão a curto prazo (24h), utilizando três métodos diferentes, sendo estes posteriormente comparados com um método de referência (baseline). A baseline utilizada consiste numa regressão linear simples, utilizando o consumo de energia elétrica verificado no instante t-24horas como variável independente. Os três métodos utilizados foram a Regressão Linear Multivariada (MLR), k-vizinhos mais próximos (KNN) e uma Rede Neuronal Artificial (ANN). Recorrendo a uma técnica estatística de agrupamento de dados (k-medoids), é ainda feita uma identificação dos perfis diários de consumo presentes na série temporal em análise, a identificar padrões diários, semanais e sazonais. Estes métodos foram aplicados à série de consumo habitacional para Portugal, BTN C, disponibilizada publicamente pela REN, utilizando os valores registados de 2014 a 2018 (inclusive). No problema em estudo a Rede Neuronal Artificial foi identificada como o melhor método. Foram obtidos MAPE de 5,6%, 4,3% e 4,2% e RMSE de 13,4MW, 11,7MW e 10,7MW para a MLR, KNN e ANN, respetivamente. Comparativamente, a baseline conseguiu um MAPE de 7,8% e um RMSE de 19,3 MW. Num nível mais granular, foram analisados em detalhe os desvios na previsão e identificadas as horas de maior consumo como as mais problemáticas de prever. O mesmo também se verificou ao nível dos meses do ano, onde os meses mais frios demonstraram ser os mais problemáticos, não só pelo o nível de intensidade do valor mas devido à variabilidade que existe nestes meses. Ao nível diário, os dias de transição de regime (sábado e segunda-feira) e o domingo apresentaram erros consideravelmente mais elevados relativamente aos restantes dias da semana. Com este trabalho, as conclusões retiradas permitem demonstrar a importância e a vantagem da aplicação das metodologias de i) agregação para compreender e caracterizar os diferentes perfis de consumo de energia elétrica e ii) previsão a curto prazo do consumo de energia elétrica com recurso ao método de aprendizagem automática, nomeadamente, Redes Neuronais Artificiais.ABSTRACT: Clean, endogenous renewable energy sources are the key to stopping (or at least slowing) climate change, as well as reducing external energy dependency. However, the large-scale integration of these stochastic sources introduces an increasing uncertainty in the electrical power system balance. This balance will need to rely not only in generation side management, but also on demand side management, as opposed to the traditional power system management paradigm, which dictates that generation should always be ready to follow demand, whose is deemed uncontrollable. Strategies such as Demand Side Management have been devised to attenuate this uncertainty. The purpose of this strategy is to provide flexibility for the power system through the electricity consumption according to the available renewable power production, or grid constraints or even tariff incentives. This entails a need for accurate consumption forecasts to enable a proper demand response. With the need for an accurate forecast as motivation, the present dissertation proposes modeling, through various methods of the electrical load considering a short-term horizon - 24 ahead. The modelling will be done by three different methods: Multiple Linear Regression (MLR), k-nearest neighbors (KNN) and an Artificial Neural Network (ANN). The models created by each method will then be compared against a baseline, a Simple Linear Regression using the load value at t – 24h as the independent variable. The typical load profiles are also evaluated, via a clustering method (k-medoids), in order to identify daily, weekly and seasonal patterns present in the data. These methods were applied to a household load time series for Portugal, BTN C, for the years 2014 through 2018, made publicly available by REN. At the end of this analysis, the Artificial Neural Network was identified as the best method, among those studied, in the present case study. The errors obtained for each method were a MAPE of 5.6%, 4.3% and 4.2%, and a RMSE of 13.4MW, 11.7MW and 10.7MW for MLR, KNN e ANN, respectively. By comparison, the baseline achieved a MAPE of 7.8% and a RMSE of 19.3 MW. On a more granular level, forecast error showed that the hours with higher demand were more difficult to accurately predict, along with higher demand months (colder months in this case). Moreover, the regime transition days (Saturdays and Mondays) as well as Sundays are the ones with the biggest errors. The conclusions drawn from the work developed show the importance and advantages of i) typical electrical load profile aggregation analysis and ii) using machine learning methods to perform short-term electrical load forecast, specifically Artificial Neural Networks.N/

    Agrupamento de dados visual interactivo

    Com a crescente geração, armazenamento e disseminação da informação nos últimos anos, o anterior problema de falta de informação transformou-se num problema de extracção do conhecimento útil a partir da informação disponível. As representações visuais da informação abstracta têm sido utilizadas para auxiliar a interpretação os dados e para revelar padrões de outra forma escondidos. A visualização de informação procura aumentar a cognição humana aproveitando as capacidades visuais humanas, de forma a tornar perceptível a informação abstracta, fornecendo os meios necessários para que um humano possa absorver quantidades crescentes de informação, com as suas capacidades de percepção. O objectivo das técnicas de agrupamento de dados consiste na divisão de um conjunto de dados em vários grupos, em que dados semelhantes são colocados no mesmo grupo e dados dissemelhantes em grupos diferentes. Mais especificamente, o agrupamento de dados com restrições tem o intuito de incorporar conhecimento a priori no processo de agrupamento de dados, com o objectivo de aumentar a qualidade do agrupamento de dados e, simultaneamente, encontrar soluções apropriadas a tarefas e interesses específicos. Nesta dissertação é estudado a abordagem de Agrupamento de Dados Visual Interactivo que permite ao utilizador, através da interacção com uma representação visual da informação, incorporar o seu conhecimento prévio acerca do domínio de dados, de forma a influenciar o agrupamento resultante para satisfazer os seus objectivos. Esta abordagem combina e estende técnicas de visualização interactiva de informação, desenho de grafos de forças direccionadas e agrupamento de dados com restrições. Com o propósito de avaliar o desempenho de diferentes estratégias de interacção com o utilizador, são efectuados estudos comparativos utilizando conjuntos de dados sintéticos e reais.With the rising generation, storage and dissemination of information in recent years, the previous problem of lack of information has become a problem of extracting useful knowledge from the information available. The visual representations of abstract information have been used to assist in interpreting the data and reveal otherwise hidden patterns. Information visualization seeks to enhance human cognition by leveraging human visual capabilities to make sense of abstract information, providing means by which humans with constant perceptual abilities can absorb increasing amounts of information. Data clustering techniques purpose is to partition a data set into several clusters, in which similar data is placed in the same cluster and dissimilar data in different clusters. More specifically, constrained clustering methods are intended to incorporate a priori knowledge in the clustering process, in order to improve data clustering quality and, simultaneously, find appropriate solutions to specific tasks or interests . This thesis studied the interactive visual clustering approach that allows the user, through interaction with a visual representation of information, to incorporate prior knowledge about the data domain in order to influence the resulting grouping to meet its objectives. This approach combines and extends interactive information visualization, force directed graph layout and constrained clustering techniques. With the purpose of evaluating the performance of different user interaction strategies, comparative studies using sets of synthetic and real data are performed