12 research outputs found
TAG: Learning Timed Automata from Logs
International audienceEvent logs are often one of the main sources of information to understand the behavior of a system. While numerous approaches have extracted partial information from event logs, in this work, we aim at inferring a global model of a system from its event logs. We consider real-time systems, which can be modeled with Timed Automata: our approach is thus a Timed Automata learner. There is a handful of related work, however, they might require a lot of parameters or produce Timed Automata that either are undeterministic or lack precision. In contrast, our proposed approach, called TAG, requires only one parameter and learns a deterministic Timed Automaton having a good tradeoff between accuracy and complexity of the automata. This allows getting an interpretable and accurate global model of the real-time system considered. Our experiments compare our approach to the related work and demonstrate its merits
Apprentissage automatique d'automates temporisés à partir de séries temporelles
This thesis explores the development of new techniques for using the observational data of a system to automatically infer behavior models. We adopt the Timed Automata formalism, a finite-state machine in which state changes are triggered by events and are constrained by time. Three main challenges are addressed: (1) learning a Timed Automaton from event sequences; (2) discretizing time series to enable the learning of Timed Automata from numerical data; and (3) learning interacting Timed Automata from time series. First, we introduce TAG, a Timed Automata learning algorithm. Experiment on synthetic data demonstrates that it achieves a better balance between overfitting and generalization than the State-of-the-Art algorithms. Then, we propose MOODES, a discretization method based on optimizing criteria favorable for learning Timed Automata, which produces multiple solutions. TAG and MOODES are applied to a time series anomaly detection challenge where we use ensembles of Timed Automata and provide explanations for the anomalies. Finally, we present discretization approach for multivariate time series that identifies and preserves the synchronizations with the aim of learning interacting automata.Cette thèse explore le développement de nouvelles techniques pour exploiter les données d’observation de système afin d’apprendre automatiquement des modèles de comportement. Nous utilisons le formalisme de l’automate temporisé, un automate fini dont les changements d’état sont déclenchés par des événements et contraints par le temps. Trois enjeux principaux sont abordés : (1) l’apprentissage d’automates temporisés à partir de séquences d’événements; (2) la discrétisation de séries temporelles pour permettre l’apprentissage d’automates temporisés à partir de données numériques; et (3) l’apprentissage d’automates temporisés en interaction à partir de séries temporelles. Tout d’abord, nous présentons TAG, un algorithme d’apprentissage d’automates temporisés. Une experience sur des données synthétiques démontre qu’il atteint un meilleur équilibre entre sur-ajustement et généralisation que les algorithmes de l’état de l’art. Ensuite, nous proposons MOODES, une méthode de discrétisation de séries temporelles basée sur l’optimisation de critères favorables à l’apprentissage d’automates temporisés. TAG et MOODES sont appliqués sur un défi de détection d’anomalies dans les séries temporelles avec une approche basée sur des ensembles d’automates. Enfin, nous présentons une nouvelle approche de discrétisation pour séries temporelles multivariées qui identifie et préserve les synchronisations afin d’apprendre des automates en interaction
Apprentissage automatique d'automates temporisés à partir de séries temporelles
This thesis explores the development of new techniques for using the observational data of a system to automatically infer behavior models. We adopt the Timed Automata formalism, a finite-state machine in which state changes are triggered by events and are constrained by time. Three main challenges are addressed: (1) learning a Timed Automaton from event sequences; (2) discretizing time series to enable the learning of Timed Automata from numerical data; and (3) learning interacting Timed Automata from time series. First, we introduce TAG, a Timed Automata learning algorithm. Experiment on synthetic data demonstrates that it achieves a better balance between overfitting and generalization than the State-of-the-Art algorithms. Then, we propose MOODES, a discretization method based on optimizing criteria favorable for learning Timed Automata, which produces multiple solutions. TAG and MOODES are applied to a time series anomaly detection challenge where we use ensembles of Timed Automata and provide explanations for the anomalies. Finally, we present discretization approach for multivariate time series that identifies and preserves the synchronizations with the aim of learning interacting automata.Cette thèse explore le développement de nouvelles techniques pour exploiter les données d’observation de système afin d’apprendre automatiquement des modèles de comportement. Nous utilisons le formalisme de l’automate temporisé, un automate fini dont les changements d’état sont déclenchés par des événements et contraints par le temps. Trois enjeux principaux sont abordés : (1) l’apprentissage d’automates temporisés à partir de séquences d’événements; (2) la discrétisation de séries temporelles pour permettre l’apprentissage d’automates temporisés à partir de données numériques; et (3) l’apprentissage d’automates temporisés en interaction à partir de séries temporelles. Tout d’abord, nous présentons TAG, un algorithme d’apprentissage d’automates temporisés. Une experience sur des données synthétiques démontre qu’il atteint un meilleur équilibre entre sur-ajustement et généralisation que les algorithmes de l’état de l’art. Ensuite, nous proposons MOODES, une méthode de discrétisation de séries temporelles basée sur l’optimisation de critères favorables à l’apprentissage d’automates temporisés. TAG et MOODES sont appliqués sur un défi de détection d’anomalies dans les séries temporelles avec une approche basée sur des ensembles d’automates. Enfin, nous présentons une nouvelle approche de discrétisation pour séries temporelles multivariées qui identifie et préserve les synchronisations afin d’apprendre des automates en interaction
Apprentissage automatique d'automates temporisés à partir de séries temporelles
This thesis explores the development of new techniques for using the observational data of a system to automatically infer behavior models. We adopt the Timed Automata formalism, a finite-state machine in which state changes are triggered by events and are constrained by time. Three main challenges are addressed: (1) learning a Timed Automaton from event sequences; (2) discretizing time series to enable the learning of Timed Automata from numerical data; and (3) learning interacting Timed Automata from time series. First, we introduce TAG, a Timed Automata learning algorithm. Experiment on synthetic data demonstrates that it achieves a better balance between overfitting and generalization than the State-of-the-Art algorithms. Then, we propose MOODES, a discretization method based on optimizing criteria favorable for learning Timed Automata, which produces multiple solutions. TAG and MOODES are applied to a time series anomaly detection challenge where we use ensembles of Timed Automata and provide explanations for the anomalies. Finally, we present discretization approach for multivariate time series that identifies and preserves the synchronizations with the aim of learning interacting automata.Cette thèse explore le développement de nouvelles techniques pour exploiter les données d’observation de système afin d’apprendre automatiquement des modèles de comportement. Nous utilisons le formalisme de l’automate temporisé, un automate fini dont les changements d’état sont déclenchés par des événements et contraints par le temps. Trois enjeux principaux sont abordés : (1) l’apprentissage d’automates temporisés à partir de séquences d’événements; (2) la discrétisation de séries temporelles pour permettre l’apprentissage d’automates temporisés à partir de données numériques; et (3) l’apprentissage d’automates temporisés en interaction à partir de séries temporelles. Tout d’abord, nous présentons TAG, un algorithme d’apprentissage d’automates temporisés. Une experience sur des données synthétiques démontre qu’il atteint un meilleur équilibre entre sur-ajustement et généralisation que les algorithmes de l’état de l’art. Ensuite, nous proposons MOODES, une méthode de discrétisation de séries temporelles basée sur l’optimisation de critères favorables à l’apprentissage d’automates temporisés. TAG et MOODES sont appliqués sur un défi de détection d’anomalies dans les séries temporelles avec une approche basée sur des ensembles d’automates. Enfin, nous présentons une nouvelle approche de discrétisation pour séries temporelles multivariées qui identifie et préserve les synchronisations afin d’apprendre des automates en interaction
Passive Learning of Timed Automata from Logs (Student Abstract)
International audienceWe propose a novel algorithm to passively learn deterministic Timed Automata from events sequences associated with the delay occurring between them. This algorithm produces models that are more specific than State-of-the-Art algorithms and that has a better identification of the temporal constraints applying on the systems
Apprentissage automatique d'automates temporisés à partir de séries temporelles
The Time Automata (TA) is a formal method used to model dynamic systems such as ecosystems, electronic circuits, or security protocols. Numerous tools have been developed for the TAs, allowing to verify system properties expressed in mathematical logic with model checking or to generate test scenarios with controller synthesis. These models are currently built manually based on the experts' knowledge of the system. The work presented in this thesis concerns the use of data from sensors linked to a system for the modeling of the latter in the form of AT. This would make it possible to model systems which we do not know how they work. These sensor data often take the form of Time Series (TS). The problem is then the search for a method of automatic learning of TA from ST. With this aim in mind, the state of the art of TA machine learning algorithms is performed, as well as the state of the art of ST discretization methods because AT is based on discrete events. The algorithms are compared and a new algorithm, SYNTHESIS, is developed by taking the strengths of each one and trying to overcome their weaknesses. Different discretization methods of the state of the art are also compared on a synthetic dataset. The data sets from the discretization methods are used to learn TAs with the different algorithms including SYNTHESIS. The best results are obtain using a Hidden Markov Model or the k-Means to discretize the data, and SYNTHESIS to learn the TA. The main perspectives of this work are the formal verification of SYNTHESIS and the search for a validation tool for the learned TAs.L’Automate Temporisé (AT) est une méthode formelle utilisée pour modéliser des systèmes dynamiques tels que des écosystèmes ou des protocoles de sécurité informatique. De nombreux outils ont été développés pour les AT, permettant de vérifier des propriétés de système avec le model checking, ou de générer des scénarios de test avec la synthèse de contrôleur. Ces modèles sont actuellement construits manuellement à partir des connaissances que les experts ont du système. Le travail présenté dans ce mémoire concerne l'utilisation de données issues de capteurs, des séries temporelles (ST), liés à un système pour la modélisation de ce dernier sous forme d’AT. La problématique est alors la recherche d'une méthode d'apprentissage automatique d'AT à partir de ST. Pour ce faire, l’état de l’art des algorithmes d’apprentissage automatique d’AT est effectué, ainsi que celui des méthodes de discrétisation des ST car l’AT repose sur des événements discrets. Les algorithmes sont comparés et un nouvel algorithme, SYNTHESIS, est développé. Différentes méthodes de discrétisation de l’état de l’art sont aussi comparées sur un jeu de données synthétique. Les jeux de données issus des méthodes de discrétisation sont utilisés pour apprendre des AT avec les différents algorithmes. C’est la discrétisation par un Modèle de Markov Caché ou par les k-Means, associée à l’apprentissage par SYNTHESIS, qui donne les meilleurs résultats. Les principales perspectives de ce travail sont la vérification formelle de SYNTHESIS et la recherche d’un outil de validation des AT appris
Apprentissage automatique d'automates temporisés à partir de séries temporelles
This thesis explores the development of new techniques for using the observational data of a system to automatically infer behavior models. We adopt the Timed Automata formalism, a finite-state machine in which state changes are triggered by events and are constrained by time. Three main challenges are addressed: (1) learning a Timed Automaton from event sequences; (2) discretizing time series to enable the learning of Timed Automata from numerical data; and (3) learning interacting Timed Automata from time series. First, we introduce TAG, a Timed Automata learning algorithm. Experiment on synthetic data demonstrates that it achieves a better balance between overfitting and generalization than the State-of-the-Art algorithms. Then, we propose MOODES, a discretization method based on optimizing criteria favorable for learning Timed Automata, which produces multiple solutions. TAG and MOODES are applied to a time series anomaly detection challenge where we use ensembles of Timed Automata and provide explanations for the anomalies. Finally, we present discretization approach for multivariate time series that identifies and preserves the synchronizations with the aim of learning interacting automata.Cette thèse explore le développement de nouvelles techniques pour exploiter les données d’observation de système afin d’apprendre automatiquement des modèles de comportement. Nous utilisons le formalisme de l’automate temporisé, un automate fini dont les changements d’état sont déclenchés par des événements et contraints par le temps. Trois enjeux principaux sont abordés : (1) l’apprentissage d’automates temporisés à partir de séquences d’événements; (2) la discrétisation de séries temporelles pour permettre l’apprentissage d’automates temporisés à partir de données numériques; et (3) l’apprentissage d’automates temporisés en interaction à partir de séries temporelles. Tout d’abord, nous présentons TAG, un algorithme d’apprentissage d’automates temporisés. Une experience sur des données synthétiques démontre qu’il atteint un meilleur équilibre entre sur-ajustement et généralisation que les algorithmes de l’état de l’art. Ensuite, nous proposons MOODES, une méthode de discrétisation de séries temporelles basée sur l’optimisation de critères favorables à l’apprentissage d’automates temporisés. TAG et MOODES sont appliqués sur un défi de détection d’anomalies dans les séries temporelles avec une approche basée sur des ensembles d’automates. Enfin, nous présentons une nouvelle approche de discrétisation pour séries temporelles multivariées qui identifie et préserve les synchronisations afin d’apprendre des automates en interaction
TAG: Learning Timed Automata from Logs
International audienceEvent logs are often one of the main sources of information to understand the behavior of a system. While numerous approaches have extracted partial information from event logs, in this work, we aim at inferring a global model of a system from its event logs. We consider real-time systems, which can be modeled with Timed Automata: our approach is thus a Timed Automata learner. There is a handful of related work, however, they might require a lot of parameters or produce Timed Automata that either are undeterministic or lack precision. In contrast, our proposed approach, called TAG, requires only one parameter and learns a deterministic Timed Automaton having a good tradeoff between accuracy and complexity of the automata. This allows getting an interpretable and accurate global model of the real-time system considered. Our experiments compare our approach to the related work and demonstrate its merits
Persistence-Based Discretization for Learning Discrete Event Systems from Time Series
International audienceTo get a good understanding of a dynamical system, it is convenient to have an interpretable and versatile model of it. Timed discrete event systems are a kind of model that respond to these requirements. However, such models can be inferred from timestamped event sequences but not directly from numerical data. To solve this problem, a discretization step must be done to identify events or symbols in the time series. Persist is a discretization method that intends to create persisting symbols by using a score called persistence score. This allows to mitigate the risk of undesirable symbol changes that would lead to a too complex model. After the study of the persistence score, we point out that it tends to favor excessive cases making it miss interesting persisting symbols. To correct this behavior, we replace the metric used in the persistence score, the Kullback-Leibler divergence, with the Wasserstein distance. Experiments show that the improved persistence score enhances Persist's ability to capture the information of the original time series and that it makes it better suited for discrete event systems learning