21 research outputs found

    Supervised recognition of random signals

    Get PDF
    The purpose of this paper is the classifïcation and the recognition of stationary ergodic random signals, which can be represented by a fixed-order ARMA process. The method consists in estimating the model parameters, in order to summarize the statistical properties of the signal in a small set of parameters. Then we define a distance measure in the representation space, the more classical being distances between power spectrum (Itukura-Saïto distance, cepstral distance. . .) or between probability laws of N-points data sequences (Kullback divergence, Bhattacharyya distance. . .). These quantities are evaluated from model parameters. But these parameters are not exactly measured; they are just estimated, and the probability law of these estimators depends on the chosen identification method. We propose to insert this fundamental feature in the definition of a distance between ARMA models identified by Maximum Likelihood method.On s'intéresse à la classification et à la reconnaissance d'échantillons finis de signaux aléatoires stationnaires ergodiques, modélisables par un processus ARMA d'ordre fixé. La méthode utilisée consiste à identifier les coefficients du modèle, de façon à condenser en un faible nombre de paramètres toutes les propriétés statistiques du signal. On définit ensuite une distance dans l'espace de représentation qui en résulte. Les distances les plus connues sont les distances entre spectres de puissance (distance d'Itakura-Saïto, distance cepstrale . . .), ou entre lois de probabilité de N-échantillons du signal (divergence de Kullback, distance de Bhattacharyya. . .), ces quantités étant calculées a partir des coefficients du modèle. Or, ces coefficients ne sont pas mesurés exactement, mais seulement estimés, et la répartition de ces estimateurs dépend de la méthode d'identification utilisée. On propose donc d'intégrer cette caractéristique fondamentale dans la définition d'une distance entre modèles ARMA identifiés par Maximum de Vraisemblance hors-ligne

    Méthodes bayésiennes pour l'analyse génétique

    Get PDF
    Ces dernières années, la génomique a connu un intérêt scientifique grandissant, notamment depuis la publication complète des cartes du génome humain au début des années 2000. A présent, les équipes médicales sont confrontées à un nouvel enjeu : l'exploitation des signaux délivrés par les puces ADN. Ces signaux, souvent de grande taille, permettent de connaître à un instant donné quel est le niveau d'expression des gênes dans un tissu considéré, sous des conditions particulières (phénotype, traitement, ...), pour un individu. Le but de cette recherche est d'identifier des séquences temporelles caractéristiques d'une pathologie, afin de détecter, voire de prévenir, une maladie chez un groupe de patients observés. Les solutions développées dans cette thèse consistent en la décomposition de ces signaux en facteurs élémentaires (ou signatures génétiques) selon un modèle bayésien de mélange linéaire, permettant une estimation conjointe de ces facteurs et de leur proportion dans chaque échantillon. L’utilisation de méthodes de Monte Carlo par chaînes de Markov sera tout particulièrement appropriée aux modèles bayésiens hiérarchiques proposés puisqu'elle permettra de surmonter les difficultés liées à leur complexité calculatoire. ABSTRACT : In the past few years, genomics has received growing scientic interest, particularly since the map of the human genome was completed and published in early 2000's. Currently, medical teams are facing a new challenge: processing the signals issued by DNA microarrays. These signals, often of voluminous size, allow one to discover the level of a gene expression in a given tissue at any time, under specic conditions (phenotype, treatment, ...). The aim of this research is to identify characteristic temporal gene expression proles of host response to a pathogen, in order to detect or even prevent a disease in a group of observed patients. The solutions developed in this thesis consist of the decomposition of these signals into elementary factors (genetic signatures) following a Bayesian linear mixing model, allowing for joint estimation of these factors and their relative contributions to each sample. The use of Markov chain Monte Carlo methods is particularly suitable for the proposed hierarchical Bayesian models. Indeed they allow one to overcome the diculties related to their computational complexity

    Modélisation de signaux temporels hautes fréquences multicapteurs à valeurs manquantes : Application à la prédiction des efflorescences phytoplanctoniques dans les rivières et les écosystèmes marins côtiers

    Get PDF
    Because of the growing interest for environmental issues and to identify direct and indirect effects of anthropogenic activities on ecosystems, environmental monitoring programs have recourse more and more frequently to high resolution, autonomous and multi-sensor instrumented stations. These systems are implemented in harsh environment and there is a need to stop measurements for calibration, service purposes or just because of sensors failure. Consequently, data could be noisy, missing or out of range and required some pre-processing or filtering steps to complete and validate raw data before any further investigations. In this context, the objective of this work is to design an automatic numeric system able to manage such amount of data in order to further knowledge on water quality and more precisely with consideration about phytoplankton determinism and dynamics. Main phase is the methodological development of phytoplankton bloom forecasting models giving the opportunity to end-user to handle well-adapted protocols. We propose to use hybrid Hidden Markov Model to detect and forecast environment states (identification of the main phytoplankton bloom steps and associated hydrological conditions). The added-value of our approach is to hybrid our model with a spectral clustering algorithm. Thus all HMM parameters (states, characterisation and dynamics of these states) are built by unsupervised learning. This approach was applied on three data bases: first one from the marine instrumented station MAREL Carnot (Ifremer) (2005-2009), second one from a Ferry Box system implemented in the eastern English Channel en 2012 and third one from a freshwater fixed station in the river Deûle in 2009 (Artois Picardie Water Agency). These works fall within the scope of a collaboration between IFREMER, LISIC/ULCO and Artois Picardie Water Agency in order to develop optimised systems to study effects of anthropogenic activities on aquatic systems functioning in a regional context of massive blooms of the harmful algae, Phaeocystis globosa.La prise de conscience des problèmes d'environnement et des effets directs et indirects des activités humaines a conduit à renforcer la surveillance haute fréquence des écosystèmes marins par l'installation de stations de mesures multicapteurs autonomes. Les capteurs, installés dans des milieux hostiles, sont sujets à des périodes de calibration, d'entretien voire des pannes et sont donc susceptibles de générer des données bruitées, manquantes voire aberrantes qu'il est nécessaire de filtrer et compléter avant toute exploitation ultérieure. Dans ce contexte, l'objectif du travail est de concevoir un système numérique automatisé robuste capable de traiter de tel volume de données afin d’améliorer les connaissances sur la qualité des systèmes aquatiques, et plus particulièrement en considérant le déterminisme et la dynamique des efflorescences du phytoplancton. L'étape cruciale est le développement méthodologique de modèles de prédiction des efflorescences du phytoplancton permettant aux utilisateurs de disposer de protocoles adéquats. Nous proposons pour cela l'emploi du modèle de Markov caché hybridé pour la détection et la prédiction des états de l'environnement (caractérisation des phases clefs de la dynamique et des caractéristiques hydrologiques associées). L'originalité du travail est l'hybridation du modèle de Markov par un algorithme de classification spectrale permettant un apprentissage non supervisé conjoint de la structure, sa caractérisation et la dynamique associée. Cette approche a été appliquée sur trois bases de données réelles : la première issue de la station marine instrumentée MAREL Carnot (Ifremer) (2005-2009), la seconde d’un système de type Ferry Box mis en œuvre en Manche orientale en 2012 et la troisième d’une station de mesures fixe, installée le long de la rivière Deûle en 2009 (Agence de l’Eau Artois Picardie - AEAP). Le travail s’inscrit dans le cadre d’une collaboration étroite entre l'IFREMER, le LISIC/ULCO et l'AEAP afin de développer des systèmes optimisés pour l’étude de l’effet des activités anthropiques sur le fonctionnement des écosystèmes aquatiques et plus particulièrement dans le contexte des efflorescences de l’algue nuisible, Phaeocystis globosa

    Analyse d'images : Filtrage et segmentation

    Get PDF
    Ouvrage publié avec l'aide du Ministère des affaires étrangères, direction de la coopération scientifique et technique. AVERTISSEMENT Le livre publié en 1995 chez MASSON (EAN13 : 9782225849237) est épuisé. Cette version pdf est une version élaborée à partie de la version préliminaire transmise à l'éditeur. La mise en page est légèrement différente de celle du livre. Malheureusement quelques figures de l'annexe C ont été perdues.International audienceL'analyse d'image touche à l'heure actuelle de nombreux domaines, avec des objectifs aussi variés que l'aide au diagnostic pour les images médicales, la vision artificielle en robotique ou l'analyse des ressources terrestres à partir des images prises par satellite. Le but du traitement de ces images est à la fois simple dans son concept et difficile dans sa réalisation. Simple en effet, puisqu'il s'agit de reconnaître des objets que notre système visuel perçoit rapidement, du moins pour la majorité d'entre eux. Difficile cependant, car dans la grande quantité d'informations contenues dans l'image, il faut extraire des éléments pertinents pour l'application visée et ceci indépendamment de la qualité de l'image. L'analyse d'image s'est donc dotée d'outils et de méthodes puissants issus de domaines aussi variés que les mathématiques, le traitement du signal, ou l'informatique. Cet ouvrage présente un des aspects les plus importants du traitement des images : la " segmentation ". Il récapitule d'abord les grandeurs observables et calculables sur une image et les algorithmes de manipulation des structures de données associées. Il détaille ensuite les traitements préliminaires, tels le filtrage du bruit et les deux types d'approche de la segmentation, l'extraction des contours et celle des régions. Chacune fait l'objet d'une étude théorique et de nombreux résultats illustrent les performances. Une des originalités de l'ouvrage est l'étude comparative des différentes techniques appliquées sur un même corpus d'images réelles

    Contribution à la surveillance des systèmes de production à l'aide des réseaux de neurones dynamiques : Application à la e-maintenance

    No full text
    Alain BOURJAULT : Professeur à l'ENSMM de Besançon, Jean-Marc FAURE : Professeur à l'ISMCM-CESTI de Paris Denis HAMAD : Professeur à Université du Littoral Côte d'Opale, Calais Raphaël LABOURIER : PDG Sté. AVENSY Ingénierie, Besançon Daniel NOYES : Professeur à l'ENI de Tarbes Daniel RACOCEANU : Maître de Conférences à l'Université de Franche-Comté Jean-Pierre THOMESSE : Professeur à l'ENSEM-INPL de Nancy, Noureddine ZERHOUNI : Professeur à l'ENSMM de BesançonThe industrial monitoring methods are divided into two categories: monitoring methods based on the existence of the equipment formal model, and those which not use any equipment formal model. Generally, there are many uncertainties in the formal model and for complex industrial equipment, it is very difficult to obtain a correct mathematical model. This thesis presents an application of the artificial neural networks to the industrial monitoring. We propose a new architecture of Radial Basis Function Networks which exploits the dynamic properties of the locally recurrent architectures for taking into account the input data temporal aspect. Indeed, the consideration of the dynamic aspect requires rather particular neural networks architectures with special training algorithms which are often very complicated. In this sense, we propose an improved version of the k-means algorithm which allows to determine easily the neural network parameters. The validation tests show that at the convergence of the learning algorithm, the neural network is situated in the zone called « good generalization zone ». The neural network was then decomposed into elementary functions easily interpretable in industrial automation languages. The applicative part of this thesis shows that a real-time monitoring treatment is possible thanks to the automation architectures. The neural network loaded in a PLC is completely configurable at distance by the TCP/IP communication protocol. An Internet connection allows then a distant expert to follow the evolution of its equipment, and also to validate the artificial neural network learning.Les méthodes de surveillance industrielle sont divisées en deux catégories : méthodes de surveillance avec modèle formel de l'équipement, et méthodes de surveillance sans modèle de l'équipement. Les modèles mathématiques formels des équipements industriels sont souvent entachés d'incertitudes et surtout difficiles à obtenir. Cette thèse présente l'application des réseaux de neurones artificiels pour la surveillance d'équipements industriels. Nous proposons une architecture de Réseaux à Fonctions de base Radiales qui exploite les propriétés dynamiques des architectures localement récurrentes pour la prise en compte de l'aspect temporel des données d'entrée. En effet, la prise en compte de l'aspect dynamique nécessite des architectures de réseaux de neurones particulières avec des algorithmes d'apprentissage souvent compliqués. Dans cette optique, nous proposons une version améliorée de l'algorithme des k-moyennes qui permet de déterminer aisément les paramètres du réseau de neurones. Des tests de validation montrent qu'à la convergence de l'algorithme d'apprentissage, le réseau de neurones se situe dans la zone appelée « zone de bonne généralisation ». Le réseau de neurones a été ensuite décomposé en fonctions élémentaires facilement interprétables en langage automate. La partie applicative de cette thèse montre qu'un traitement de surveillance en temps réel est possible grâce aux architectures à automates programmables industriels. Le réseau de neurones chargé dans l'automate est entièrement configurable à distance par le protocole de communication TCP/IP. Une connexion Internet permet alors à un expert distant de suivre l'évolution de son équipement et également de valider l'apprentissage du réseau de neurones artificiel

    Reconnaissance supervisée et non supervisée de lois à partir d'échantillons finis

    Get PDF
    International audienceDans cet article, nous abordons le problème de la reconnaissance de lois de probabilité à partir d'échantillons variant de 100 à 10 000 ou plus. Le contexte applicatif porte sur la modélisation de canaux radio-mobile en situation de visibilité ou de non-visibilité directe entre émetteur et récepteur. Ce problème est crucial pour améliorer les communications numériques. Dans la communauté des transmissions numériques, il est courant d'utiliser la distance de Kolmogorov-Smirnov. Plus rarement, une méthode à noyau est considérée avant le test comparatif. Nous proposons d'utiliser les critères d'information (IC), d'une part pour approcher les lois de probabilité par un histogramme, et d'autre part pour sélectionner le meilleur modèle de loi. Nous étudions les cas supervisé et non supervisé et comparons les méthodes dans ces situations réalistes. Les résultats montrent l'intérêt d'utiliser les méthodes exploitant les IC

    Analyse du dispositif de formation TÉRA visant le développement de la compétence éthique chez des gestionnaires scolaires

    Get PDF
    Cette étude porte sur l'analyse du dispositif de formation TÉRA : vers une Trajectoire Éthique, Responsable et Authentique. Cette formation vise à sensibiliser des gestionnaires scolaires à l'utilisation d'une démarche éthique dans leur processus décisionnel et à exercer un leadership éthique dans leur organisation. On analyse le dispositif mis en place dans le cadre de la formation afin d'en dégager ses principes et ses caractéristiques pour ensuite identifier de quel modèle théorique il relève. Le modèle de formation, dit formation-action, est identifié par Guy Le Boterf comme étant un modèle favorisant le développement de compétences. À la lumière de ce modèle, une appréciation du dispositif de formation TÉRA est effectuée pour dégager ses forces et ses faiblesses et voir s'il offre les conditions requises pour permettre aux participants (ici, des gestionnaires scolaires) de développer leur sensibilité éthique, étape préalable au développement de leur compétence éthique

    L'AIS : une donnée pour l'analyse des activités en mer

    Get PDF
    4 pages, session "Mer et littoral"International audienceCette contribution présente des éléments méthodologiques pour la description des activités humaines en mer dans une perspective d'aide à la gestion. Différentes procédures, combinant l'exploitation de bases de données spatio-temporelles issue de données AIS archivées à des analyses spatiales au sein d'un SIG, sont testées afin de caractériser le transport maritime en Mer d'Iroise (Bretagne, France) sur les plans spatiaux, temporels et quantitatifs au cours d'une année
    corecore