49 research outputs found

    Méthodes des moments pour l'inférence de systÚmes séquentiels linéaires rationnels

    Get PDF
    Learning stochastic models generating sequences has many applications in natural language processing, speech recognitions or bioinformatics. Multiplicity Automata (MA) are graphical latent variable models that encompass a wide variety of linear systems. In particular, they can model stochastic languages, stochastic processes and controlled processes. Traditional learning algorithms such as the one of Baum-Welch are iterative, slow and may converge to local optima. A recent alternative is to use the Method of Moments (MoM) to design consistent and fast algorithms with pseudo-PAC guarantees.However, MoM-based algorithms have two main disadvantages. First, the PAC guarantees hold only if the size of the learned model corresponds to the size of the target model. Second, although these algorithms learn a function close to the target distribution, most do not ensure it will be a distribution. Thus, a model learned from a finite number of examples may return negative values or values that do not sum to one.This thesis addresses both problems. First, we extend the theoretical guarantees for compressed models, and propose a regularized spectral algorithm that adjusts the size of the model to the data. Then, an application in electronic warfare is proposed to sequence of the dwells of a superheterodyne receiver. Finally, we design new learning algorithms based on the MoM that do not suffer the problem of negative probabilities. We show for one of them pseudo-PAC guarantees.L’apprentissage de modĂšles stochastiques gĂ©nĂ©rant des sĂ©quences a de nombreuses applications comme en traitement de la parole, du langage ou bien encore en bio-informatique. Les Automates Ă  MultiplicitĂ© (MA) sont des modĂšles graphiques Ă  variables latentes qui englobent une grande variĂ©tĂ© de systĂšmes linĂ©aires pouvant reprĂ©senter entre autres des langues stochastiques, des processus stochastiques ainsi que des processus contrĂŽlĂ©s. Les algorithmes traditionnels d’apprentissage comme celui de Baum-Welch sont itĂ©ratifs, lent et peuvent converger vers des optima locaux. Une alternative rĂ©cente consiste Ă  utiliser la mĂ©thode des moments (MoM) pour concevoir des algorithmes rapides et consistent avec des garanties pseudo-PAC.Cependant, les algorithmes basĂ©s sur la MoM ont deux inconvĂ©nients principaux. Tout d'abord, les garanties PAC ne sont valides que si la dimension du modĂšle appris correspond Ă  la dimension du modĂšle cible. DeuxiĂšmement, bien que les algorithmes basĂ©s sur la MoM apprennent une fonction proche de la distribution cible, la plupart ne contraignent pas celle-ci Ă  ĂȘtre une distribution. Ainsi, un modĂšle appris Ă  partir d’un nombre fini d’exemples peut renvoyer des valeurs nĂ©gatives et qui ne somment pas Ă  un.Ainsi, cette thĂšse s’adresse Ă  ces deux problĂšmes en proposant 1) un Ă©largissement des garanties thĂ©oriques pour les modĂšles compressĂ©s et 2) de nouveaux algorithmes d’apprentissage ne souffrant pas du problĂšme des probabilitĂ©s nĂ©gatives et dont certains bĂ©nĂ©ficient de garanties PAC. Une application en guerre Ă©lectronique est aussi proposĂ©e pour le sĂ©quencement des Ă©coutes du rĂ©cepteur superhĂ©tĂ©ordyne

    Développement durable et responsabilité sociétale : de la contradiction au dépassement

    Get PDF
    http://www.emse.fr/aslc2009/pdf/textes%20pour%20les%20actes%202.pdfNational audienceIl est classique de présenter le développement durable comme un oxymore, une contradiction dans les termes environnement et développement. En nous appuyant sur la théorie de la négociation nous pouvons au contraire le concevoir comme une valeur nouvelle issue d'une sorte de " négociation coopérative " environnement/développement (Aurélien Boutaud114). Cette négociation a été orchestrée par les Nations Unies (rapport Brundtland 1987) et validée politiquement à Rio en 1992. Cette valeur nouvelle permet un dépassement de la contradiction. Elle rajoute un modÚle coopératif à un modÚle dominant fondé sur la seule compétition : on recherche systématiquement une approche triplement gagnante dans les domaines économique, social et environnemental.

    Représentation des connaissances scientifiques en vue de leur transfert vers l'industrie (Application à la valorisation des produits à base de bois en fin de vie)

    Get PDF
    La thĂšse s intĂ©resse au transfert de connaissances scientifiques en valorisation des produits Ă  base de bois en fin de vie vers les acteurs de la filiĂšre bois. La question de recherche est : Comment transfĂ©rer les connaissances scientifiques (recueil et reprĂ©sentation des connaissances) sur la valorisation des produits Ă  base de bois en fin de vie pour qu'elles puissent ĂȘtre assimilĂ©es et utilisĂ©es par les acteurs de la filiĂšre bois ? Le recueil des connaissances a combinĂ© des sĂ©ances d'interview de spĂ©cialistes avec l acquisition des connaissances Ă  partir d articles scientifiques. Les connaissances recueillies ont Ă©tĂ© reformulĂ©es afin de faciliter leur transfert vers les acteurs de la filiĂšre bois : les concepts pertinents, relations d'influence entre les concepts et rĂ©sultats scientifiques ont Ă©tĂ© respectivement reprĂ©sentĂ©s via des cartes conceptuelles, graphes d'influence, et fiches de connaissances. Un modĂšle canonique de cartes conceptuelles a Ă©tĂ© proposĂ© afin de permettre une reprĂ©sentation homogĂšne des concepts. La transmission, l assimilation et l'utilisation potentielle des connaissances Ă  transfĂ©rer ont Ă©tĂ© traitĂ©es comme suit : La transmission a Ă©tĂ© proposĂ©e via un livre Ă©lectronique (hypermĂ©dia) de connaissances, L assimilation a Ă©tĂ© prise en compte via la reformulation des connaissances et une reprĂ©sentation graphique des connaissances suivant une carte conceptuelle canonique et un format prĂ©dĂ©fini de fiches. L utilisation potentielle des connaissances transfĂ©rĂ©es a Ă©tĂ© renforcĂ©e par la reprĂ©sentation des leviers d'action sur les concepts du domaine sous forme de graphes d'influence. Les performances de transfert Ă  partir du livre ont Ă©tĂ© Ă©valuĂ©es en fonction du degrĂ© de comprĂ©hension du contenu du livre, la charge cognitive de l utilisateur au cours de l utilisation du livre de connaissances et sa dĂ©sorientation. L expĂ©rience a montrĂ© que la forme canonique dĂ©veloppĂ©e est intuitive ; et, tout comme la navigation dans le livre, n'occasionne pas de dĂ©sorientation ou surcharge cognitive de l'utilisateur. Les rĂ©sultats obtenus montrent, au sein de la filiĂšre bois, tout l intĂ©rĂȘt de la reprĂ©sentation proposĂ©e pour le transfert de connaissances scientifiques vers des professionnels.This thesis focuses on the transfer of scientific knowledge on recovered wood to practitioners of the wood sector. The research question is: how to transfer the scientific knowledge (collect and representation of knowledge and the transmission medium) on the recovered wood so that they may assimilate and used by non-scientific personnel of the wood sector ? Knowledge was first collected through interviews with specialists in the re-use of recovered wood and combined with acquisition of knowledge from scientific publications. The collected knowledge was then reformulated to facilitate its transfer to practitioners in the wood sector. The relevant concepts, the influences between concepts and relevant scientific results werere spectively represented via concept maps, influence graphs, and knowledge sheets. A canonical model of concept maps is proposed to enable a homogeneous representation of concepts. Transmission, assimilation and potential utilization of knowledge transfer were treated as follows : The transmission is proposed via an electronic (hypermedia) knowledge-book, the assimilation (absorption) has been taken into account through the reformulation of knowledge and a graphical representation of knowledge following a canonical concept map and sheets with a predefined format and The potential use of the transferred knowledge is facilitated by the representation of the action levers on the domain concepts in the form of influence graphs. The efficiency of knowledge transfer via the knowledge book has been evaluated according to the degree of understanding of the book content, the cognitive load of the user during use of the knowledge-book and the disorientation it caused. The experience has shown that the developed canonical form is intuitive and, like navigation in the book, does not cause disorientation or cognitive over load to the user. This promotes the assimilation and the use of the knowledge-book content. The obtained results indicate that the representation of relevant knowledge in a knowledge-book should facilitate for the transfer of scientific knowledge to professionals in the wood sector.NANTES-ENS Mines (441092314) / SudocSudocFranceF

    TOTh 2007 : Terminologie et Ontologie : Théories et Applications. Annecy 1er Juin 2007

    Get PDF
    National audienceProceedings of the TOTh 2007 Conference: Terminology and Ontology: Theories and Applications. Annecy, France 1st June 200

    Vers une vision systémique du processus de l'explication : récit d'une recherche sur l'intégration de la pédagogie, de l'ingénierie et de la modélisation

    Full text link
    ThÚse numérisée par la Direction des bibliothÚques de l'Université de Montréal

    DĂ©veloppement des algorithmes pour l’automatisation de la classification des donnĂ©es utilisant les rĂ©seaux de neurones probabilistes (PNN). Application Ă  l’analyse, la catĂ©gorisation et la cartographie des images de tĂ©lĂ©dĂ©tection.

    Get PDF
    The main topic of this thesis is modeling and classification for analyzing and processing digital data. Our objective is the realization of a set of algorithms to automate data classification using probabilistic neural networks (PNN). The considered data are remote sensing images.We propose a novel procedure for automatic classification based on PNN. We used unsupervised methods to search for classes in the learning phase; we built a function to validate classes inspired from fuzzy clustering techniques and we adapted our procedure to be applied on multidimensional data such as satellite images. Before applying this approach toremote sensing images, we conducted a series of tests on various types of synthetic and real data. These tests have produced very convincing results in comparison to usual unsupervised methods.We applied our algorithm in order to build land cover maps from satellite images. So, we have to analyze high spatial resolution images representing the study area for identifying all existing vegetation patterns. The classification is applied on sequence of NDVI time series data derived from satellite images. The aim is to test all of the developed algorithms on realcases to highlight their performance. These tests have demonstrated once again that the proposed approaches are entirely capable to produce successful classification. In semi-arid regions such as the region of Marrakech Tensift El Haouz, mapping land cover contributes extremely in evapotranspiration flow estimation used for water management.Le thĂšme principal de cette thĂšse est la modĂ©lisation et la classification pour l’analyse et le traitement de l’information contenue dans les donnĂ©es numĂ©riques. Notre contribution est la rĂ©alisation d’un ensemble d’algorithmes pour l’automatisation de la classification des donnĂ©es en utilisant les rĂ©seaux de neurones probabilistes (PNN). Les donnĂ©es considĂ©rĂ©es sont les images de tĂ©lĂ©dĂ©tection. Cette thĂšse s’adresse non seulement aux numĂ©riciens et spĂ©cialistes du traitement des images, mais aussi aux chercheurs et praticiens dans plusieurs domaines tels que la tĂ©lĂ©dĂ©tection qui utilisent la classification des donnĂ©es en gĂ©nĂ©ral et l’analyse de l’information pour la modĂ©lisation en particulier. Nous proposons une nouvelle procĂ©dure de classification automatique fondĂ©e sur les PNN. Nous avons utilisĂ© des mĂ©thodes non supervisĂ©es pour la recherche des classes Ă  la phase de l’apprentissage. Nous avons construit une fonction pour la validitĂ© des classes en s’inspirant des techniques de classification automatique floue. Nous avons aussi adaptĂ© notre procĂ©dure pour l’application sur des donnĂ©es multidimensionnelles telles que les images satellitaires. Avant d’appliquer cette approche sur des images de tĂ©lĂ©dĂ©tection, nous avons menĂ© une sĂ©rie de tests sur plusieurs types de donnĂ©es synthĂ©tiques et rĂ©elles. Ces tests ont abouti Ă  des rĂ©sultats trĂšs convaincants en comparaison avec les mĂ©thodes non supervisĂ©esusuelles, ce qui a conduit Ă  valider la performance de nos algorithmes. Dans la partie application Ă  la tĂ©lĂ©dĂ©tection, l’objectif est d’élaborer des cartes d’occupation du sol Ă  partir des images satellitaires. Nous avons analysĂ© les images Ă  haute rĂ©solution spatiale reprĂ©sentant la rĂ©gion Ă©tudiĂ©e pour identifier tous les profils de vĂ©gĂ©tation existants. La classification est menĂ©e en se basant sur les images de l’indice de vĂ©gĂ©tation NDVI extraites des images satellitaires SPOT. L’objet Ă  classifier est une sĂ©rie temporelle de sept scĂšnes NDVI. Le but est de tester l’ensemble des algorithmes dĂ©veloppĂ©s sur des cas rĂ©els pour mettre en Ă©vidence leur performance. Ces tests ont dĂ©montrĂ© encore une fois de plus que les approches proposĂ©es sont tout Ă  fait aptes Ă  produire une classificationperformante.Nous avons classifiĂ© et analysĂ© les images satellitaires d’une rĂ©gion semi-aride de Marrakech Tensift El Haouz. Le rĂ©sultat obtenu est une cartographie prĂ©cise de l’occupation du sol. Ce rĂ©sultat contribuera d’une façon importante dans le dressage des cartes du flux d’évapotranspiration pour Ă©tablir un bilan hydrique de la rĂ©gion

    La définition du terme «mot» en grammaire française contemporaine : une approche par la sémantique lexico-grammaticale

    Get PDF
    Cette thĂšse approfondit la notion de mot qui a cours en grammaire française contemporaine. Plus prĂ©cisĂ©ment, elle fait ressortir les problĂšmes qui dĂ©coulent du fait d’employer un concept relevant de la pensĂ©e commune (le mot) pour Ă©laborer une explication scientifique du langage. Elle examine la maniĂšre dont les linguistes exploitent cette notion dans la tradition grammaticale et dans trois courants thĂ©oriques marquant la linguistique moderne (structuralisme, fonctionnalisme, gĂ©nĂ©rativisme); elle Ă©value Ă©galement les stratĂ©gies employĂ©es par ces approches pour rĂ©gler les problĂšmes posĂ©s par la dĂ©finition et l’emploi du concept de mot dans la description linguistique. Comme voie de rĂ©solution de ces problĂšmes, elle propose la notion de morpholexĂšme, qui correspond Ă  l’unitĂ© significative associant en permanence un signifiĂ© lexical Ă  un signifiĂ© grammatical, de maniĂšre Ă  former une unitĂ© qui se ramĂšnent dans l’ensemble aux unitĂ©s considĂ©rĂ©es comme faisant partie des classes de mots variables, qui correspondent Ă  environ 97 % du lexique du français.This thesis examines the concept of word used in contemporary French grammar. Specifically, it highlights issues which stem from using a concept belonging to ordinary language (the word) to develop a scientific explanation of human language. It investigates how linguists exploit this notion in the grammatical tradition and in three theoretical currents which have made their mark in modern linguistics (structuralism, functionalism, generativism). It also assesses the strategies used by these approaches to solve the problems related to the definition and usage of the concept of word in the linguistic description. To address these issues, it proposes the concept of morpholexeme, which corresponds to a linguistic unit permanently combining a lexical meaning and a grammatical meaning, as a basis for identifying a homogenous category corresponding to morphologically variable words, a category covering close approximately 97 % of the French lexicon

    Le modĂšle flot de donnĂ©es appliquĂ© Ă  la synthĂšse haut-niveau pour le traitement d’images sur camĂ©ra intelligente Ă  base de FPGA. Application aux systĂšmes d’apprentissage supervisĂ©s

    Get PDF
    High-level synthesis is a field of research that aims to automate the transformation from an high-level algorithmic description to a register level representation for its implementation on a digital circuit. Most of existing tools based on imperative languages try to provide a general solution to any type of existing algorithm. This approach can be inefficient in some applications where the algorithm description relies on a different paradigm from the hardware execution model. This major drawback can be figured out by the use of specific langages, named Domain Specific Language (DSL). Applied to the image processing field, the dataflow model appears as a good compromise between the expressiveness of the algorithm description and the final implementation efficiency. This thesis address the use of the dataflow programming model as response to high-level synthesis problematics for image processing algorithms on FPGA. To demonstrate the effectiveness of the proposed method but also to put forth the algorithmic reformulation effort to be made by the developer, an ambitious class of applications was chosen : supervised machine learning systems. It will be addressed in particular two algorithms, a classification system based on Support Vector Machine and a convolutional neural network. Experiments will be made with the CAPH langage, a specific HLS tool based on the dataflow programming model.La synthĂšse de haut niveau (High Level Synthesis (HLS)) est un domaine de recherche qui vise Ă  automatiser le passage de la description d’un algorithme Ă  une reprĂ©sentation au niveau registre de celui-ci en vue de son implantation sur un circuit numĂ©rique. Si le problĂšme reste Ă  ce jour largement ouvert pour des algorithmes quelconques, des solutions ont commencĂ© Ă  voir le jour au sein de domaines spĂ©cifiques. C’est notamment le cas dans le domaine du traitement d’images oĂč l’utilisation du modĂšle flot de donnĂ©es offre un bon compromis entre expressivitĂ© et efficacitĂ©. C’est ce que nous cherchons Ă  dĂ©montrer dans cette thĂšse, qui traite de l’applicabilitĂ© du modĂšle flot de donnĂ©es au problĂšme de la synthĂšse haut niveau Ă  travers deux exemples d’implantation d’applications de vision complexes sur FPGA. Les applications, issues du domaine de l’apprentissage supervisĂ© sont un systĂšme de classification Ă  bases de machines Ă  vecteurs supports (SVM) et un systĂšme de reconnaissance exploitant un rĂ©seau de neurones convolutionnels (CNN). Dans les deux cas, on Ă©tudie les problĂ©matiques posĂ©es par la reformulation, au sein du modĂšle flot de donnĂ©es, des structures de donnĂ©es et algorithmes associĂ©s ainsi que l’impact de cette reformulation sur l’efficacitĂ© des implĂ©mentations rĂ©sultantes. Les expĂ©rimentations sont menĂ©es avec CAPH, un outil de HLS exploitant le modĂšle flot de donnĂ©es
    corecore