22 research outputs found

    Forêts aléatoires et sélection de variables : analyse des données des enregistreurs de vol pour la sécurité aérienne

    Get PDF
    New recommendations require airlines to establish a safety management strategy to keep reducing the number of accidents. The flight data recorders have to be systematically analysed in order to identify, measure and monitor the risk evolution. The aim of this thesis is to propose methodological tools to answer the issue of flight data analysis. Our work revolves around two statistical topics: variable selection in supervised learning and functional data analysis. The random forests are used as they implement importance measures which can be embedded in selection procedures. First, we study the permutation importance measure when the variables are correlated. This criterion is extended for groups of variables and a new selection algorithm for functional variables is introduced. These methods are applied to the risks of long landing and hard landing which are two important questions for airlines. Finally, we present the integration of the proposed methods in the software FlightScanner implemented by Safety Line. This new solution in the air transport helps safety managers to monitor the risks and identify the contributed factors.De nouvelles réglementations imposent désormais aux compagnies aériennes d'établir une stratégie de gestion des risques pour réduire encore davantage le nombre d'accidents. Les données des enregistreurs de vol, très peu exploitées à ce jour, doivent être analysées de façon systématique pour identifier, mesurer et suivre l'évolution des risques. L'objectif de cette thèse est de proposer un ensemble d'outils méthodologiques pour répondre à la problématique de l'analyse des données de vol. Les travaux présentés dans ce manuscrit s'articulent autour de deux thèmes statistiques : la sélection de variables en apprentissage supervisé d'une part et l'analyse des données fonctionnelles d'autre part. Nous utilisons l'algorithme des forêts aléatoires car il intègre des mesures d'importance pouvant être employées dans des procédures de sélection de variables. Dans un premier temps, la mesure d'importance par permutation est étudiée dans le cas où les variables sont corrélées. Nous étendons ensuite ce critère pour des groupes de variables et proposons une nouvelle procédure de sélection de variables fonctionnelles. Ces méthodes sont appliquées aux risques d'atterrissage long et d'atterrissage dur, deux questions importantes pour les compagnies aériennes. Nous présentons enfin l'intégration des méthodes proposées dans le produit FlightScanner développé par Safety Line. Cette solution innovante dans le transport aérien permet à la fois le monitoring des risques et le suivi des facteurs qui les influencent

    Grouped variable importance with random forests and application to multiple functional data analysis

    Full text link
    The selection of grouped variables using the random forest algorithm is considered. First a new importance measure adapted for groups of variables is proposed. Theoretical insights into this criterion are given for additive regression models. Second, an original method for selecting functional variables based on the grouped variable importance measure is developed. Using a wavelet basis, it is proposed to regroup all of the wavelet coefficients for a given functional variable and use a wrapper selection algorithm with these groups. Various other groupings which take advantage of the frequency and time localization of the wavelet basis are proposed. An extensive simulation study is performed to illustrate the use of the grouped importance measure in this context. The method is applied to a real life problem coming from aviation safety

    Structured Feature Selection of Continuous Dynamical Systems for Aircraft Dynamics Identification

    Get PDF
    This paper addresses the problem of identifying structured nonlinear dynamical systems, with the goal of using the learned dynamics in model-based reinforcement learning problems. We present in this setting a new class of scalable multi-task estimators which promote sparsity, while preserving the dynamics structure and leveraging available physical insight. An implementation leading to consistent feature selection is suggested, allowing to obtain accurate models. An additional regularizer is also proposed to help in recovering realistic hidden representations of the dynamics. We illustrate our method by applying it to an aircraft trajectory optimization problem. Our numerical results based on real flight data from 25 medium haul aircraft, totaling 8 millions observations, show that our approach is competitive with existing methods for this type of application

    Random forests and variable selection : analysis of the flight data recorders for aviation safety

    No full text
    De nouvelles réglementations imposent désormais aux compagnies aériennes d'établir une stratégie de gestion des risques pour réduire encore davantage le nombre d'accidents. Les données des enregistreurs de vol, très peu exploitées à ce jour, doivent être analysées de façon systématique pour identifier, mesurer et suivre l'évolution des risques. L'objectif de cette thèse est de proposer un ensemble d'outils méthodologiques pour répondre à la problématique de l'analyse des données de vol. Les travaux présentés dans ce manuscrit s'articulent autour de deux thèmes statistiques : la sélection de variables en apprentissage supervisé d'une part et l'analyse des données fonctionnelles d'autre part. Nous utilisons l'algorithme des forêts aléatoires car il intègre des mesures d'importance pouvant être employées dans des procédures de sélection de variables. Dans un premier temps, la mesure d'importance par permutation est étudiée dans le cas où les variables sont corrélées. Nous étendons ensuite ce critère pour des groupes de variables et proposons une nouvelle procédure de sélection de variables fonctionnelles. Ces méthodes sont appliquées aux risques d'atterrissage long et d'atterrissage dur, deux questions importantes pour les compagnies aériennes. Nous présentons enfin l'intégration des méthodes proposées dans le produit FlightScanner développé par Safety Line. Cette solution innovante dans le transport aérien permet à la fois le monitoring des risques et le suivi des facteurs qui les influencent.New recommendations require airlines to establish a safety management strategy to keep reducing the number of accidents. The flight data recorders have to be systematically analysed in order to identify, measure and monitor the risk evolution. The aim of this thesis is to propose methodological tools to answer the issue of flight data analysis. Our work revolves around two statistical topics: variable selection in supervised learning and functional data analysis. The random forests are used as they implement importance measures which can be embedded in selection procedures. First, we study the permutation importance measure when the variables are correlated. This criterion is extended for groups of variables and a new selection algorithm for functional variables is introduced. These methods are applied to the risks of long landing and hard landing which are two important questions for airlines. Finally, we present the integration of the proposed methods in the software FlightScanner implemented by Safety Line. This new solution in the air transport helps safety managers to monitor the risks and identify the contributed factors

    Classification non supervisée de courbes basée sur l'information au second ordre : détection de la dégradation de l'état de pistes d'atterrissage

    No full text
    International audienceIn air transportation, especially in airport safety, radar tracks are continuously recorded and may be used for detecting incidents on airport surface. However, all known statistical algorithms, even those based on functional data, are unable to distinguish between a safety critical flight and another one departing from standard behavior, but otherwise safe. In this work, we propose a change of paradigm by representing curves as points in a shape manifold. In this framework, it is possible to use Finsler distances between shapes that explicitly take into account the second derivative and can be able to 1 correctly detect skid situations from deviant trajectories that cannot be considered as a slipped trajectory. This metric is next used in curve clustering for detecting bad runway conditions. Some results on datasets of synthetic and real trajectories are presented, as well as a comparison of existing metrics.Sur la plupart des plateformes aéroportuaires, les déplacements des aéronefs sont enregistrés en continu par des radars de surveillance et les trajectoires ainsi obtenues peuvent être utilisées pour détecter ou prévenir des incidents lors du roulage, en particu-lier des dérapages. Cependant, l'exploitation de ces données est rendue difficile par le fait que les algorithmes statistiques connus, même ceux basés sur des données fonctionnelles, ne sont pas capables de distinguer les situations réellement dangereuses des déviations au comportement standard qui sont sans gravité. Dans cette étude, nous proposons un chan-gement de paradigme en représentant les trajectoires comme des points dans un espace de formes. Dans ce nouveau cadre, il est possible de construire des distances de type Fins-ler, prenant explicitement en compte les dérivées secondes des trajectoires, et qui sont en mesure de bien séparer les trajectoires présentant un dérapage de celles dont la déviation par rapport au comportement nominal n'est pas due à un manque d'adhérence. Cette métrique est ensuite utilisée dans des méthodes de clustering pour détecter un mauvais état de la piste d'atterrissage. Des résultats sur des jeux de données de trajectoires syn-thétiques et réelles sont présentés ainsi qu'une comparaison avec des métriques existantes. Mots-clés. Similarité entre courbes, espace de formes, données fonctionnelles, classification non supervisée de courbes, sécurité aéroportuaire

    Curve clustering based on second order information: application to bad runway condition detection

    No full text
    In air transportation, a huge amount of data is continuously recorded such as radar tracks that may be used for improving flight as well as airport safety. However, all known statistical algorithms, even those based on functional data, are unable to distinguish between a safety critical flight and another one departing from standard behavior, but otherwise safe. It is the case in airport safety when radar measurements are used for detecting incidents on airport surface. In this paper, we propose a change of paradigm by switching from a functional data framework to a geometrical one by representing curves as points in a shape manifold. In this way, any intrinsic structure of the data that is amenable to geometry can be directly encoded in the representation space. Based on an extension of a classical distance between shapes, a new one is defined, that explicitly takes into account the second derivative and can be related to slippery. Its properties are investigated in a first part, then some results on datasets of synthetic and real trajectories are presented

    Gaussian Mixture Penalty for Trajectory Optimization Problems

    Get PDF
    International audienceWe consider the task of solving an aircraft trajectory optimization problem where the system dynamics have been estimated from recorded data. Additionally, we want to avoid optimized trajectories that go too far away from the domain occupied by the data, since the model validity is not guaranteed outside this region. This motivates the need for a proximity indicator between a given trajectory and a set of reference trajectories. In this presentation, we propose such an indicator based on a parametric estimator of the training set density. We then introduce it as a penalty term in the optimal control problem. Our approach is illustrated with an aircraft minimal consumption problem and recorded data from real flights. We observe in our numerical results the expected trade-off between the consumption and the penalty term

    Quantifying the Closeness to a Set of Random Curves via the Mean Marginal Likelihood

    Get PDF
    In this paper, we tackle the problem of quantifying the closeness of a newly observed curve to a given sample of random functions, supposed to have been sampled from the same distribution. We define a probabilistic criterion for such a purpose, based on the marginal density functions of an underlying random process. For practical applications, a class of estimators based on the aggregation of multivariate density estimators is introduced and proved to be consistent. We illustrate the effectiveness of our estimators, as well as the practical usefulness of the proposed criterion, by applying our method to a dataset of real aircraft trajectories

    Aircraft Dynamics Identification for Optimal Control

    Get PDF
    International audienceFour new Maximum Likelihood based approaches for aircraft dynamics identification are presented and compared. The motivation is the need of accurate dynamic models for minimizing aircraft fuel consumption using optimal control techniques. A robust method for building aerodynamic models is also suggested. All these approaches were validated using real flight data from 25 different aircraft
    corecore