Aplicação de interpretabilidade para melhorar o desempenho de um classificador LSTM para eventos de sistema de potência

Abstract

Orientador: Daniel DottaDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: Atualmente, uma grande quantidade de dados é coletada pelos WAMS (Wide Area Measurement Systems). Portanto, existe uma clara necessidade de métodos de aprendizagem de máquina (ML - Machine Learning), capazes de extrair informações relevantes e confiáveis dos dados de sincrofasores. Entre as abordagens de ML, os modelos de Rede Neural Profunda (DNN - Deep Neural Network) têm a vantagem de aprender diretamente com os dados, tornando essas abordagens não dependentes das técnicas de extração de atributos. No entanto, esses modelos profundos produzem classificadores caixa-preta (black-box) que podem suscitar preocupações quando aplicados a ambientes de alto risco (infraestrutura crítica), como o sistema elétrico de potência (EPS-Electric Power Systems). Neste trabalho, a aplicação de um método orientado a dados (data-driven) explicável é realizada a fim de inspecionar o desempenho do classificador DNN para identificação de eventos usando medições de sincrofasores. O classificador DNN é uma LSTM (Long-Short Term Memory) que tem demostrado bom desempenho na extração de características dinâmicas. A principal vantagem dessa abordagem é o uso de uma inspeção baseada em interpretabilidade denominada SHAP (SHapley Additive exPlanation), que é baseada na teoria dos jogos cooperativos (valores Shapley), que fornece os meios para avaliar as previsões da LSTM, destacando as partes das séries temporais de entrada que mais contribuíram para a identificação dos eventos e detecção de possíveis vieses. Além disso, usando a inspeção SHAP juntamente com o conhecimento de domínio (domain knowledge) sobre o problema, o desempenho e a coerência do classificador LSTM são aprimorados ao escolher o classificador que não apenas possui a maior acurácia de identificação (IAR - Identification Accuracy Rate), mas também é coerente com o conhecimento de domínio do problema, minimizando possíveis vieses detectados. O uso dessa abordagem interpretável é útil porque: i) explica como o classificador LSTM está tomando suas decisões; ii) ajuda o designer a melhorar o treinamento do classificador; iii) certifica que o classificador resultante tem um desempenho consistente e coerente de acordo com o conhecimento do domínio; iv) quando o usuário entende que o classificador está tomando decisões coerentes, reduz claramente as preocupações da aplicação dos métodos DNN em uma infraestrutura crítica. O método proposto é avaliado usando registros reais de eventos sincrofasores do Sistema Interligado Nacional (SIN)Abstract: Nowadays, vast amounts of data are collected by Wide Area Measurement Systems (WAMS). Therefore, there is an obvious necessity for Machine Learning (ML) methods, as useful knowledge to extract relevant and reliable information from this synchrophasor data. Among the ML approaches, the Deep Neural Network (DNN) models provide an important opportunity to advance direct learning from the data, making these approaches independent from feature extraction techniques. However, these deep models produce black-box classifiers that can be matter of concern when applying to high-risk environment (critical infrastructure) such as the EPS (Electric Power Systems). In this work, the application of an explainable data-driven method is carried out in order to inspect the performance of DNN classifier for event identification using synchrophasor measurements. The DNN classifier is a Long-Short Term Memory (LSTM) with positive performance in the extraction of dynamic features. The principal benefit of this approach is the use of an interpretability inspection named SHAP (SHapley Additive exPlanation) values, which are based on cooperative game theory (Shapley values). These SHAP values provide the means to evaluate the predictions of the LSTM, highlight the parts of the input time-series with the most contribution to the identification of the events, and detect possible bias. Moreover, by employing the SHAP inspection along with domain knowledge of the problem, the performance and coherence of the LSTM classifier will be improved by choosing the classifier that not only has highest Identification Accuracy Rate (IAR) but is also coherent with domain knowledge of the problem, minimizing detected bias. The application of this interpretable approach is desirable because: i) it explains how the LSTM classifier is making its decisions; ii) it helps the designer to improve the training of the classifier; iii) it certifies that the resulting classifier has a consistent and coherent performance according to domain knowledge of the problem; iv) it clearly reduces the concerns of the application of DNN methods in a critical infrastructure, in the cases that the user understands that the classifier is taking coherent decisions. The proposed method has been evaluated using real synchrophasor event records from the Brazilian Interconnected Power System (BIPS)MestradoEnergia ElétricaMestre em Engenharia Elétrica2017/25425-5FAPES

    Similar works