4 research outputs found
Log-based software monitoring: a systematic mapping study
Modern software development and operations rely on monitoring to understand
how systems behave in production. The data provided by application logs and
runtime environment are essential to detect and diagnose undesired behavior and
improve system reliability. However, despite the rich ecosystem around
industry-ready log solutions, monitoring complex systems and getting insights
from log data remains a challenge.
Researchers and practitioners have been actively working to address several
challenges related to logs, e.g., how to effectively provide better tooling
support for logging decisions to developers, how to effectively process and
store log data, and how to extract insights from log data. A holistic view of
the research effort on logging practices and automated log analysis is key to
provide directions and disseminate the state-of-the-art for technology
transfer.
In this paper, we study 108 papers (72 research track papers, 24 journals,
and 12 industry track papers) from different communities (e.g., machine
learning, software engineering, and systems) and structure the research field
in light of the life-cycle of log data.
Our analysis shows that (1) logging is challenging not only in open-source
projects but also in industry, (2) machine learning is a promising approach to
enable a contextual analysis of source code for log recommendation but further
investigation is required to assess the usability of those tools in practice,
(3) few studies approached efficient persistence of log data, and (4) there are
open opportunities to analyze application logs and to evaluate state-of-the-art
log analysis techniques in a DevOps context
Monitorização de sistemas embebidos para aplicações críticas
Trabalho de projeto para obtenção do Grau de Mestre em Engenharia Informática e de ComputadoresOs sistemas informáticos encontram-se em constante evolução, seja para a adição de novas funcionalidades ou para a correção de problemas no seu funcionamento. Para acompanhar este crescimento, são necessários sistemas de registo de eventos também conhecidos por logging, da sua designação em língua inglesa, para monitorizar e apoiar o diagnóstico dos problemas e falhas no funcionamento das aplicações funcionais, tanto em ambiente de teste como de produção. Estas necessidades também existem para as soluções Internet of Things (IoT), no entanto, nesta área da informática é ainda mais imperioso tomar boas decisões para a realização de um processo de logging eficaz, e que não afete o funcionamento normal destes sistemas. Por outro lado, o ambiente Cloud tem-se revelado essencial para qualquer processamento externo efetuado sobre os logs e respetiva visualização da informação em dashboards. O sistema CardioWheel é uma solução IoT de monitorização do estado dos utilizadores durante a atividade de condução criada pela empresa CardioID que requer o desenvolvimento de um sistema de logging para rastrear e observar o fluxo de dados na aplicação. A ocorrência de informação sensível, referente aos dados biométricos relativos ao estado do utilizador, obriga a uma decisão ainda cuidada na construção das diferentes componentes do sistema de logging. O trabalho realizado no âmbito desta dissertação visou, portanto, investigar e propor uma solução que, cumprindo com as limitações dos sistemas IoT, permitisse uma boa dinâmica de monitorização do CardioWheel. A solução desenvolvida utiliza a biblioteca logging disponibilizada pela framework Espressif para guardar a informação gerada em memória externa, posteriormente enviada após o fim da sessão de logging presente ou, em caso de falha, após a terminação de vii viii sessões futuras. A biblioteca CycloneSSH foi, portanto, adaptada para garantir a integridade e a segurança no envio do ficheiro de sessão que contém os eventos log da sessão. Em ambiente Cloud, o Logstash foi utilizado para interpretar, transformar e redirecionar a informação recebida para posterior análise e visualização na plataforma Opensearch. Os resultados obtidos da implementação demonstraram-se encorajadores face à limitações mencionadas na medida que, após a introdução da solução, não ocorreu um grande impacto em nenhum dos pontos críticos dos dispositivos IoT. Porém, existem melhorias a efetuar com uma finalidade de otimizar o ciclo de vida da declaração log no sistema.Informatic systems find themselves in constant evolution, being by the addition of new functionalities or by bug fixing. To keep up with its growth, the introduction of an event or logging recording system is required to monitor and support the diagnosis of problems and failures in functional applications in test and production environments. This need also exists in IoT solutions and good decisions must be made to guarantee an effective logging process that doesn’t impact the normal functioning of the system. On the other hand, the use of a Cloud environment has been shown beneficial for both external processing made on logs and the respective visualization of information in dashboards. CardioWheel is an IoT solution created by CardioID that monitors the overall state of its user during driving activity and requires the development of a logging system to track and observe data flow in the application. The occurrence of sensitive user information demands a carefully planned design of the different components in the logging system. The work carried out within the scope of this dissertation aims to investigate and propose a solution that complies with all the mentioned limitations in IoT systems to allow a dynamic monitoring process of CardioWheel. The proposed solution uses the logging library provided by the Espressif framework to save the necessary information in external memory, to be eventually sent at the end of the current logging session or, in the case of failure, future sessions. We adapted the CycloneSSH library to guarantee integrity and safety during the transmission of the file that contains the session logging events. In the Cloud environment, we used Logstash to interpret, transform, and redirect the received information to be later viewed and analyzed on the OpenSearch platform. ix x The described implementation was encouraging as it had minimal impact on the critical points of the IoT devices. Although, it is still possible to further optimize the life cycle of the logging event in the system.N/
ネットワークログの因果解析による障害の原因究明支援技術に関する研究
学位の種別: 課程博士審査委員会委員 : (主査)東京大学教授 稲葉 雅幸, 東京大学教授 千葉 滋, 東京大学教授 山西 健司, 東京大学教授 江崎 浩, 東京大学准教授 中山 雅哉, 東京大学講師 中山 英樹University of Tokyo(東京大学