58 research outputs found

    Approches topologiques pour l'analyse exploratoire de données et l'aide à la décision

    Get PDF
    Depuis au moins les premières pierres taillées de l'ère Paléolithique,les hommes n'ont cessé de créer des artefacts, moyens d'agir sur leur environnementet moyens de l'observer au-delà de leurs capacités propres.Ils ont développé ces outils pour les assister dans leur quête viscérale decompréhension (sciences) et de maîtrise (techniques) de ce monde dont ilsfont partie. Cette compréhension du monde est nécessaire pour en prédireles états, et la maîtrise qui en découle est le moyen de ne plus le subir maisde l'asservir pour réduire les sourances qu'il nous assène par nature. Enplus de transformer le Monde, les hommes ont aussi pu réparer, corriger etaugmenter leur propre corps par des orthèses et des prothèses biologiques,chimiques, mécaniques ou numériques. La multiplication de ces moyensd'agir et d'observer entraîne un accroissement exponentiel des donnéesdésormais capturées dont la masse est supposée assurer les hommes decontenir toute l'information utile à leur quête. Cette massication desdonnées impose de développer des méthodes d'analyse et de traitementtoujours plus ecaces pour que les hommes qui les étudient ou appuientleurs décisions sur elles puissent continuer à le faire et à le faire mieux. J'aiproposé diérentes approches dans les champs de l'analyse descriptive etde la modélisation prédictive an de rendre plus intelligible la chaîne detraitement de l'information du capteur à l'écran. J'ai placé la Topologieau coeur de mes travaux. En eet, je considère qu'elle forme le substratessentiel à l'interprétabilité de l'information, c'est-à-dire à la transmissiondu sens dans cette chaîne, et in ne à la compréhension et à la maîtrisedu Monde par l'Homme.Le développement permanent des artefacts techniques pour tenter demieux comprendre et maîtriser le Monde, entretient la croissance de sacomplexité, à la fois parce que grâce aux artefacts développés pour lascience et la technologie, nous accédons à des mécanismes toujours plusprécis et plus nombreux qui le gouvernent, mais aussi parce que les artefactstechniques engendrés par ces connaissances nouvelles, font partieintégrante du Monde lui-même et en modient le fonctionnement. Auxcauses naturelles s'entremêlent les causes articielles. C'est pour certainsauteurs [Crutzen, Geology of Mankind, Nature 415(6867):23, 2002] une nouvelle ère qui a commencée au 19e siècle, l'ère de l'Anthropocène , dans laquelle l'intelligence des hommes les a dotés de moyenstechniques capable de modier durablement leur écosystème et en particulierles mécanismes de la Sélection Naturelle qui ont engendrée cette intelligence.Il est vraissemblable que ce développement aboutira à l'émergencede machines intelligentes, conscientes et émotionnelles capables d'explorerce monde par elles-mêmes et de communiquer aux hommes leurs conclusionssur les lois qui le gouvernent, comme le font déjà quelques machinesencore rudimentaires mais ecaces [Sparkes et al. An integrated laboratory robotic system for autonomousdiscovery of gene function, JALA 15(1):33-40, 2010]. Ces machines sont la forme ultimede ces orthèses dont les hommes cherchent à se doter depuis le Paléolithique pour tenter de dépasser leur condition. Avant que n'adviennece moment singulier que Kurzweil appelle la Singularité [Kurzweil,The singularity is near : when humans transcendbiology. http ://books.google.fr/books ?id=88U6hdUi6D0C, 2005.], où les machinesautonomes seront en mesure de dépasser l'homme et de développerpour elles-mêmes des connaissances et des techniques, des questionséthiques seront posées qui mèneront soit à l'abandon du développementde telles machines, soit à la nécessité impérieuse de les maîtriser. Il seraalors impératif que les processus internes et les produits de ces machinessoient intelligibles aux hommes an qu'ils en comprennent le sens et enconservent le contrôle. C'est ainsi tout l'enjeu de mes recherches actuelleset futures

    Détection de la présence humaine et évaluation de la qualité du sommeil en établissement d’hébergement pour personnes âgées dépendantes (EHPAD)

    Get PDF
    In France, in Europe and worldwide, the aging population is a reality. Some of these elderly people lose their autonomy as they are no longer able to manage alone the tasks of daily life. The societal issue is therefore to ensure a level of well-being and safety of these persons, consistent with changes in living standards, customs and modern habits. The research areas related to the problems of elderly people at home are showing great dynamism, while the nursing home, which remains the solution for cases of high dependence, is somewhat neglected. Nevertheless, staff shortages combined with rising costs and residents’ demands offer an opportunity for innovative ICT-based solutions. The work presented here was performed, in the context of a CIFRE doctoral thesis, within the Legrand research team and at the physics and electronics department of Mines-Telecom SudParis at Evry. The subject and project aim was twofold: firstly, designing a new sensor which will be incorporated in the electrical installation of the patient’s living space, and secondly, a multi-sensor merger to monitor the activity of the resident in order to enable real-time reporting of situations requiring the caregiver’s intervention or to detect slow drifts whose interpretation will be the responsibility of the medical staff. The work carried out for the purpose of this thesis has been included partially in the FUI 14 project whose propose is precisely the “supervision of residents in the nursing home”. The present paper is structured in such a way as to introduce the background of the work and the approach taken to perform it. The context and needs identified for monitoring of nursing home residents are also introduced. We begin by describing existing monitoring systems and the technical methods used to detect emergency situations. We end the first part (chapter 1) of this paper by specifying the major problem encountered when testing existing monitoring systems based on ambient sensors: namely how to detect the presence of an immobile and silent person in the room. Using an existing pyro-electric infrared sensors network installation in a nursing home, the next section proposes an original solution for detecting human presence in a room and also for differentiating between the presence of one and the presence of more than one person (chapter 2). Chapter 3 presents a new sensor integrated into the electrical installation of the patient’s living space. Here, we introduce a thermopile based thermal sensor in order to detect the presence of a person in his/her living space. In this work we restrict the use of this sensor to detecting the presence of the person in bed (chapter 4). The estimation of sleep quality which represents the original dimension of our work is presented in chapter 5. Differentiation between different phases of sleep is based on unsupervised classification approaches. Our project opens up encouraging prospects for the use of this type of sensor for relatively fine characterization of different kinds of sleepEn France, en Europe et dans le monde entier, le vieillissement de la population est une réalité. Une partie de cette population âgée est dite dépendante car elle n’est plus en mesure d’assumer seule les tâches de la vie quotidienne. L’enjeu sociétal est alors de garantir un niveau de bien-être et de sécurité à ces personnes, compatible avec l’évolution du niveau de vie et des usages et habitudes ‘modernes’. Très logiquement, les domaines de recherche liés à la problématique des personnes âgées à domicile font preuve d’un grand dynamisme, alors que la maison de retraite, qui reste la solution pour la grande dépendance, a été un peu délaissée. Néanmoins, la pénurie de personnel conjuguée à l’augmentation des coûts et des exigences des résidents offre une opportunité à des solutions innovantes basées sur les TIC. Les travaux de cette thèse de doctorat sous convention CIFRE se sont déroulés dans ce contexte au sein de l’équipe de recherche de Legrand et du département d’Electronique et Physique de Télécom SudParis à Evry. Le sujet concerne la conception d’un nouveau capteur (non-porté) intégrant l’installation électrique du lieu de vie du patient ainsi que la fusion avec d’autres capteurs de l’infrastructure afin de suivre l’activité du résident et, le cas échéant, soit signaler en temps réel des situations nécessitant le recours d’un aidant, soit identifier des dérives lentes dont l’interprétation sera du ressort du personnel médical. Les travaux de la thèse ont été en partie intégrés au projet FUI14 « E-monitor’âge » dont l’objectif est précisément la « supervision » des résidents. Ce mémoire est structuré de manière à présenter l’historique de ces travaux et la démarche opérée pour leur réalisation. Nous introduisons le contexte et les besoins identifiés pour le suivi des personnes âgées dans les maisons de retraites. Nous faisons un point sur les systèmes de supervision/monitoring existants et nous présentons les méthodes et les techniques de détection de situations d’urgence. Nous terminons cette partie du mémoire (chapitre 1) par la spécification du problème majeur rencontré par ces systèmes de supervision qui est celui de la détection de présence d’une personne. En s’appuyant sur la technologie des capteurs pyro-électriques, la partie suivante propose une solution originale de traitement de signal pour la détection d’une présence humaine dans une chambre voire la détection de présence de plusieurs personnes à la fois (chapitre 2). Le chapitre 3 introduit ensuite un capteur thermique à base de thermopiles afin de détecter la présence d’une personne dans son lit, ce que ne permet pas la technologie pyro-électrique qui ne détecte pas un corps chaud immobile. Dans cette partie nous limitons l’utilisation de ce capteur à la détection de la présence de la personne dans son lit (chapitre 4) voire à l’estimation de la qualité de son sommeil qui constitue d’une part l’originalité de nos travaux s’appuyant sur des approches de classification non-supervisée, et qui ouvre des perspectives encourageantes quant à l’utilisation de ce capteur pour caractériser relativement finement le type de sommeil d’autre part (chapitre 5

    Optimisation d'ensembles de classifieurs non paramétriques avec apprentissage par représentation partielle de l'information

    Get PDF
    L'un des défis de la reconnaissance de formes (RF) est de concevoir des systèmes à la fois simples (peu de paramètres, faible coût de calcul) et performants (haut taux de reconnaissance). Il est démontré que les ensembles de classifieurs (EoC) peuvent permettre d'obtenir de meilleures performances qu'un classifieur unique, d'où la recherche d'un compromis entre simplicité et performance. L'utilisation de classifieurs non paramétriques de type k-NN ayant une représentation partielle de l'information favorise toutefois la simplicité d'un système de RF. Dans le présent travail, nous avons utilisé un tel ensemble de k-NN pour vérifier s'il était possible de concevoir des EoC par sélection de classifieurs pour améliorer la simplicité tout en augmentant la performance du système. L'utilisation d'un algorithme d'optimisation pouvant explorer de grands espaces mal définis est nécessaire pour atteindre cet objectif. Afin d'aider la recherche, différentes mesures de «diversité» sont proposées dans la littérature. Nous avons tenté d'optimiser un EoC à l'aide de différentes méthodes de recherche et avons testé l'effet de la maximisation conjointe de la performance avec un échantillon des mesures de diversité les plus populaires. Toutes les expériences ont été répétées 30 fois de façon à pouvoir comparer, à l'aide de tests statistiques, les différentes approches évaluées. Nous avons découvert que la maximisation conjointe de la simplicité et de la performance était la meilleure façon de créer un ensemble optimisant ces deux objectifs. Par contre, pour générer des ensembles ayant une performance maximale, l'utilisation d'un algorithme de recherche à un seul objectif est préférable. Contrairement à nos attentes, il n'a pas été possible de démontrer un avantage significatif à l'utilisation d'une mesure de diversité comme critère d'optimisation. À notre connaissance, c'était la première fois qu'était étudiée de manière exhaustive la façon de faire de la sélection de classifieurs de type k-NN basés sur le paradigme des sous-espaces aléatoires. L'application systématique de tests statistiques pour valider les résultats des stratégies de sélection de classifieurs a été rendue possible grâce à l'utilisation d'une grappe d'ordinateurs et à la création de base de données de votes précalculés. Cette validation statistique est rarement mise en oeuvre dans le domaine

    Processing of numerical check amounts. A segmentation-based approach

    Get PDF
    We present an automatic recognition system applied to handwritten numeral chec k amounts which is based on a segmentation–by–recognition probabilistic model . This system is descrided from the amount field localization on the document image to the generation ofhypotheses. An explicit segmentation algorithm determines potential cuts between characters and provides a spatial representation ofsegmented components . The best path for the segmentation is determined by the combinatio n of recognition scores, of segmentation likelihoods and of a priori probabilities of amounts. Training is done through a bootstrapping technique, which significantly improves the performances of the different algorithms . It also allows the use of a reject class at the recognition step . The robustness of the system was assessed on a database of 10,000 real cheques images.Nous présentons un système de lecture automatique des montants numériques des chèques dont le principe repose sur une technique de segmentation des caractères validée par la reconnaissance. Ce système est décrit depuis la phase de localisation du champ montant sur le document numérisé, jusqu'à la génération de la liste des hypothèses de montant. La segmentation, de type explicite, permet de déterminer des zones de coupure potentielles entre caractères et fournit une représentation spatiale des composantes segmentées. Le meilleur chemin de segmentation du montant est déterminé par la combinaison des scores de reconnaissance des caractères, de la vraisemblance de la segmentation et de la probabilité d'apparition de ce montant. Un apprentissage est effectué à partir d'un algorithme d'étiquetage automatique qui améliore nettement les performances des différents modules et a également permis l'intégration d'une classe rejet au niveau du module de reconnaissance. Afin de pouvoir quantifier la robustesse de ce système, nous avons mesuré ses performances à partir d'une base de 10 000 images de montants de chèques réels

    Étude de techniques d'apprentissage non-supervisé pour l'amélioration de l'entraînement supervisé de modèles connexionnistes

    Full text link
    Thèse numérisée par la Division de la gestion de documents et des archives de l'Université de Montréal

    Contribution au pronostic de défaut dans les systèmes complexes par les techniques intelligentes

    Get PDF
    Nous avons présenté une nouvelle approche basée sur l'utilisation d'une méthode guidée par les données pour le pronostic des défauts. Cette méthode requiert des données décrivant le processus de dégradation. Lorsque les données sont insuffisantes, la prédiction des états devient difficile avec les modèles profonds de type mémoire à long terme (LSTM), qui nécessitent une quantité importante de données d'apprentissage. Pour résoudre ce problème de rareté des données dans la prédiction de la durée de vie restante (RUL), nous proposons d'adopter une stratégie d'augmentation des données. Les résultats obtenus sont démontrent que l'application d'une stratégie d'augmentation des données, peut améliorer les performances de prédiction de la RUL en utilisant les techniques LSTM. Nous avons validé cette approche en utilisant les données de la NASA Commercial Modular Aero-Propulsion System Simulation (C-MAPPS)

    Désambiguïsation dans la typification de données textuelles à des fins d'analyses catégorielles

    Get PDF

    Contribution à l'analyse de la dynamique des écritures anciennes pour l'aide à l'expertise paléographique

    Get PDF
    Mes travaux de thèse s inscrivent dans le cadre du projet ANR GRAPHEM1 (Graphemebased Retrieval and Analysis for PaleograpHic Expertise of Middle Age Manuscripts). Ilsprésentent une contribution méthodologique applicable à l'analyse automatique des écrituresanciennes pour assister les experts en paléographie dans le délicat travail d étude et dedéchiffrage des écritures.L objectif principal est de contribuer à une instrumetation du corpus des manuscritsmédiévaux détenus par l Institut de Recherche en Histoire des Textes (IRHT Paris) en aidantles paléographes spécialisés dans ce domaine dans leur travail de compréhension de l évolutiondes formes de l écriture par la mise en place de méthodes efficaces d accès au contenu desmanuscrits reposant sur une analyse fine des formes décrites sous la formes de petits fragments(les graphèmes). Dans mes travaux de doctorats, j ai choisi d étudier la dynamique del élément le plus basique de l écriture appelé le ductus2 et qui d après les paléographes apportebeaucoup d informations sur le style d écriture et l époque d élaboration du manuscrit.Mes contributions majeures se situent à deux niveaux : une première étape de prétraitementdes images fortement dégradées assurant une décomposition optimale des formes en graphèmescontenant l information du ductus. Pour cette étape de décomposition des manuscrits, nousavons procédé à la mise en place d une méthodologie complète de suivi de traits à partir del extraction d un squelette obtenu à partir de procédures de rehaussement de contraste et dediffusion de gradients. Le suivi complet du tracé a été obtenu à partir de l application des règlesfondamentales d exécution des traits d écriture, enseignées aux copistes du Moyen Age. Il s agitd information de dynamique de formation des traits portant essentiellement sur des indicationsde directions privilégiées.Dans une seconde étape, nous avons cherché à caractériser ces graphèmes par desdescripteurs de formes visuelles compréhensibles à la fois par les paléographes et lesinformaticiens et garantissant une représentation la plus complète possible de l écriture d unpoint de vue géométrique et morphologique. A partir de cette caractérisation, nous avonsproposé une approche de clustering assurant un regroupement des graphèmes en classeshomogènes par l utilisation d un algorithme de classification non-supervisé basée sur lacoloration de graphe. Le résultat du clustering des graphèmes a conduit à la formation dedictionnaires de formes caractérisant de manière individuelle et discriminante chaque manuscrittraité. Nous avons également étudié la puissance discriminatoire de ces descripteurs afin d obtenir la meilleure représentation d un manuscrit en dictionnaire de formes. Cette étude a étéfaite en exploitant les algorithmes génétiques par leur capacité à produire de bonne sélection decaractéristiques.L ensemble de ces contributions a été testé à partir d une application CBIR sur trois bases demanuscrits dont deux médiévales (manuscrits de la base d Oxford et manuscrits de l IRHT, baseprincipale du projet), et une base comprenant de manuscrits contemporains utilisée lors de lacompétition d identification de scripteurs d ICDAR 2011. L exploitation de notre méthode dedescription et de classification a été faite sur une base contemporaine afin de positionner notrecontribution par rapport aux autres travaux relevant du domaine de l identification d écritures etétudier son pouvoir de généralisation à d autres types de documents. Les résultats trèsencourageants que nous avons obtenus sur les bases médiévales et la base contemporaine, ontmontré la robustesse de notre approche aux variations de formes et de styles et son caractèrerésolument généralisable à tout type de documents écrits.My thesis work is part of the ANR GRAPHEM Project (Grapheme based Retrieval andAnalysis for Expertise paleographic Manuscripts of Middle Age). It represents a methodologicalcontribution applicable to the automatic analysis of ancient writings to assist the experts inpaleography in the delicate work of the studying and deciphering the writing.The main objective is to contribute to an instrumentation of the corpus of medievalmanuscripts held by Institut de Recherche en Histoire de Textes (IRHT-Paris), by helping thepaleographers specialized in this field in their work of understanding the evolution of forms inthe writing, with the establishment of effective methods to access the contents of manuscriptsbased on a fine analysis of the forms described in the form of small fragments (graphemes). Inmy PhD work, I chose to study the dynamic of the most basic element of the writing called theductus and which according to the paleographers, brings a lot of information on the style ofwriting and the era of the elaboration of the manuscript.My major contribution is situated at two levels: a first step of preprocessing of severelydegraded images to ensure an optimal decomposition of the forms into graphemes containingthe ductus information. For this decomposition step of manuscripts, we have proceeded to theestablishment of a complete methodology for the tracings of strokes by the extraction of theskeleton obtained from the contrast enhancement and the diffusion of the gradient procedures.The complete tracking of the strokes was obtained from the application of fundamentalexecution rules of the strokes taught to the scribes of the Middle Ages. It is related to thedynamic information of the formation of strokes focusing essentially on indications of theprivileged directions.In a second step, we have tried to characterize the graphemes by visual shape descriptorsunderstandable by both the computer scientists and the paleographers and thus unsuring themost complete possible representation of the wrting from a geometrical and morphological pointof view. From this characterization, we have have proposed a clustering approach insuring agrouping of graphemes into homogeneous classes by using a non-supervised classificationalgorithm based on the graph coloring. The result of the clustering of graphemes led to theformation of a codebook characterizing in an individual and discriminating way each processedmanuscript. We have also studied the discriminating power of the descriptors in order to obtaina better representation of a manuscript into a codebook. This study was done by exploiting thegenetic algorithms by their ability to produce a good feature selection.The set of the contributions was tested from a CBIR application on three databases ofmanuscripts including two medieval databases (manuscripts from the Oxford and IRHTdatabases), and database of containing contemporary manuscripts used in the writersidentification contest of ICDAR 2011. The exploitation of our description and classificationmethod was applied on a cotemporary database in order to position our contribution withrespect to other relevant works in the writrings identification domain and study itsgeneralization power to other types of manuscripts. The very encouraging results that weobtained on the medieval and contemporary databases, showed the robustness of our approachto the variations of the shapes and styles and its resolutely generalized character to all types ofhandwritten documents.PARIS5-Bibliotheque electronique (751069902) / SudocSudocFranceF
    corecore