138 research outputs found

    Analyse Factorielle Discriminante Multi-voie

    No full text
    L'analyse factorielle discriminante est étendue aux données multi-voie, c'est-à-dire aux données pour lesquelles plusieurs modalités ont été observées pour chaque variable. Les données multi-voie sont ainsi structurées en tenseur. L'extension proposée repose sur une modélisation des axes discriminants. Cette modélisation prend en compte la structure tensorielle des données. Les gains attendus par rapport aux méthodes consistant à construire un classifieur à partir de la matrice obtenue par dépliement du tenseur, sont une meilleure interprétabilité et un meilleur comportement vis-à-vis du surapprentissage, phénomène d'autant plus présent dans le contexte multi-voie que le nombre de modalités est grand. Un algorithme de directions alternées permet d'obtenir les axes discriminants. Les performances obtenues sur données simulées permettent de confirmer ces gains

    Multiway Regularized Generalized Canonical Correlation Analysis

    No full text
    National audienceL'Analyse Canonique Généralisée Régularisée (RGCCA) permet l'´ etude des relations entre différents blocs de données. Dans ce papier, une version multivoie de RGCCA (MGCCA) est proposée. MGCCA cherche a décrire et comprendre les relations entre tenseurs

    Caractérisation des coefficients de Strickler d'un fleuve par inversion probabiliste

    No full text
    International audienceLa caractérisation statistique des coefficients de rugosité du lit et des berges d'un fleuve (coefficients de Strickler) permet à la fois d'évaluer les risques d'inondation et de prévoir le renforcement des ouvrages à proximité. Il s'agit dans cette étude de caractériser ces coefficients à partir de mesures de débit associées à des mesures de hauteurs d'eau. Un logiciel de calcul hydraulique donne les hauteurs d'eau à partir des coefficients de Strickler. Des algorithmes d'inversion probabiliste sont mis en oeuvre afin de modéliser la densité de probabilité des coefficients de Strickler. Deux approches sont testées : l'une est une variante de l'algorithme EM, l'autre est de type MCMC

    Model-Robust Design of Experiments for Sequential Identification of ODE Parameters

    No full text
    International audienceThis paper presents the idea of sequential model-robust Design of Experiments (DOE) for the identification of dynamic systems modeled with an Ordinary Differential Equation (ODE). The studied DOE problem consists in selecting sequentially the instants where the measures will be done in order to best estimate the system's parameter. The robustness is achieved by considering a statistical representation of the model error defined as the difference between the true ODE and the ODE used in the model. The idea of modeling the model error with a statistical representation has been widely explored in the DOE literature for the identification of static systems. However, there have been little previous works that apply this idea for the identification of dynamic systems. This paper initiates an exploration of this idea in the context of first-order ODE. The model error is modeled by using a kernel-based representation (Gaussian process). A new criterion for the instant selection is constructed and tested on an illustrative example. The design reached with the proposed sequential robust criterion is compared with the design reached with the non-robust version of criterion and with the classical uniform design

    Analyse différentielle de puces à ADN. Comparaison entre méthodes wrapper et filter.

    Get PDF
    13Dans le cadre de données d'expression génétique, nous nous intéressons aux méthodes qui permettent d'identifier les gènes significativement différentiellement exprimés entre deux situations biologiques. Nous allons comparer une méthode classique d'analyse par tests d'hypothèses à des méthodes d'analyse différentielle par régression régularisée. La difficulté de ce genre de jeu de données est la profusion de variables (les gènes) pour assez peu d'individus (les profils d'expression). La stratégie usuelle consiste à mettre en oeuvre autant de tests qu'il y a de variables et de considérer que les variables principales sont celles qui ont la « meilleure »p-value. Une stratégie alternative pourrait consister à choisir de classer les variables non plus en fonction de leur significativité (pour un test), mais plutôt de le classer suivant leur poids dans le modèle régularisé obtenu. Dans la bibliographie, les premières méthodes sont dites filter1, les deuxièmes sont plutôt dites wrapper2. Un bon aperçu de ce que sont les méthodes wrapper et filter est donné dans [9]. Le cadre ressemble à celui de l'apprentissage supervisé, car on dispose de profils d'expression géniques pour si possible l'ensemble du génome d'un organisme, chaque puce appartenant à une classe- situation biologique particulière (par exemple malade vs sain). L'implémentation des méthodes évoquées dans ce rapport a été effectuée sous R [16]

    Sequential experimental Design for Misspecified Nonlinear Models

    No full text
    International audienceIn design of experiments for nonlinear regression model identification, the design criterion depends on the unknown parameters to be identified. Classical strategies consist in designing sequentially the experiments by alternating the estimation and design stages. These strategies consider previous observations (collected data) only while estimating the unknown parameters during the estimation stages. This paper proposes to consider the previous observations not only during the estimation stages, but also by the criterion used during the design stages. Furthermore, the proposed criterion considers the robustness requirement: an unknown model error (misspecification) is supposed to exist and is modeled by a kernel-based representation (Gaussian process). Finally, the proposed sequential criterion is compared with a model-robust criterion which does not consider the previously collected data during the design stages, with the classical D-optimal and L-optimal criteria

    Régression régularisée par contrainte de variabilité

    Get PDF
    - La variabilité d'une base d'apprentissage est définie. Elle permet, pour les problèmes de régression, la construction d'a priori sur la solution cherchée : en imposant à la solution cherchée d'avoir une variabilité proche de celle de la base d'apprentissage, on augmente sa robustesse. L'approche est illustrée sur un exemple de régression paramétrique (régression polynomiale) et sur un exemple de régression non-paramétrique (approximation par noyaux). Dans le premier exemple, le risque d'overfitting est contenu, ce qui permet d'explorer un vaste espace de solutions potentielles (régression polynomiale d'ordre élevé) alors que dans le deuxième exemple, l'approche donne une estimation de la largeur du noyau proche de la valeur optimale

    MODEL-ROBUST SEQUENTIAL DESIGN OF EXPERIMENTS FOR IDENTIFICATION PROBLEMS

    No full text
    International audienceA new criterion for sequential design of experiments for linear regression model is developed. Considering the information provided by previous collected data is a well-known strategy to decide for the next design point in the case of nonlinear models. The paper applies this strategy for linear models. Besides, the problem is addressed in the context of robustness requirement: an unknown deviation from the linear regression model (called model error or misspecification) is supposed to exist and is modeled by a kernel-based representation (Gaussian process). The new approach is applied on a polynomial regression example and the obtained designs are compared with other designs obtained from other approaches that do not consider the information provided by previously collected data

    Soft sensor design for power measurement and diagnosis in electrical furnace: A parametric estimation approach

    Get PDF
    International audienceIn this paper, we propose as a first step a software solution to measure the electrical power consumed in an industrial furnace intended essentially for heat treatments. The soft sensor is constructed from the power physical measurement taken as the output of the set (dimmer + resistances), and the control signal measurement provided by a controller with an unknown structure. The second step consists in a detection of faults like a resistance disconnection, for instance. This phase requires the knowledge of the controller model and the furnace system. An overparametrization method was chosen for the controller estimation. An indirect closed-loop Input-Output (IO) identification approach was used for the furnace model estimation through a Tailor-Made and a decomposition of the closed-loop algorithms. A validation with two other experimental tests concludes the paper

    CAMPAGNE DE MESURE POUR UNE ÉTUDE DE L'EXPOSITION DE LA POPULATION FRANÇAISE AU CHAMP MAGNÉTIQUE 50 HZ

    No full text
    Longtemps considérés comme inoffensifs, les champs magnétiques (CM) alternatifs de fréquence 50 Hz liés à l'électricité en particulier, sont suspectés depuis une trentaine d'années d'être responsables de pathologies, notamment de leucémies chez l'enfant. Les dernières expertises collectives [1] ont conclu que la dernière grande interrogation en ce qui concerne les CM basse fréquence est l'association statistique observée dans plusieurs analyses conjointes entre l'augmentation du risque de leucémie de l'enfant et une exposition aux CM supérieure à 0,4 μT en valeur moyenne sur 24 heures
    • …
    corecore