Search CORE

49 research outputs found

Méthodes des moments pour l'inférence de systèmes séquentiels linéaires rationnels

Author: Glaude Hadrien
Publication venue: HAL CCSD
Publication date: 08/07/2016
Field of study

Learning stochastic models generating sequences has many applications in natural language processing, speech recognitions or bioinformatics. Multiplicity Automata (MA) are graphical latent variable models that encompass a wide variety of linear systems. In particular, they can model stochastic languages, stochastic processes and controlled processes. Traditional learning algorithms such as the one of Baum-Welch are iterative, slow and may converge to local optima. A recent alternative is to use the Method of Moments (MoM) to design consistent and fast algorithms with pseudo-PAC guarantees.However, MoM-based algorithms have two main disadvantages. First, the PAC guarantees hold only if the size of the learned model corresponds to the size of the target model. Second, although these algorithms learn a function close to the target distribution, most do not ensure it will be a distribution. Thus, a model learned from a finite number of examples may return negative values or values that do not sum to one.This thesis addresses both problems. First, we extend the theoretical guarantees for compressed models, and propose a regularized spectral algorithm that adjusts the size of the model to the data. Then, an application in electronic warfare is proposed to sequence of the dwells of a superheterodyne receiver. Finally, we design new learning algorithms based on the MoM that do not suffer the problem of negative probabilities. We show for one of them pseudo-PAC guarantees.L’apprentissage de modèles stochastiques générant des séquences a de nombreuses applications comme en traitement de la parole, du langage ou bien encore en bio-informatique. Les Automates à Multiplicité (MA) sont des modèles graphiques à variables latentes qui englobent une grande variété de systèmes linéaires pouvant représenter entre autres des langues stochastiques, des processus stochastiques ainsi que des processus contrôlés. Les algorithmes traditionnels d’apprentissage comme celui de Baum-Welch sont itératifs, lent et peuvent converger vers des optima locaux. Une alternative récente consiste à utiliser la méthode des moments (MoM) pour concevoir des algorithmes rapides et consistent avec des garanties pseudo-PAC.Cependant, les algorithmes basés sur la MoM ont deux inconvénients principaux. Tout d'abord, les garanties PAC ne sont valides que si la dimension du modèle appris correspond à la dimension du modèle cible. Deuxièmement, bien que les algorithmes basés sur la MoM apprennent une fonction proche de la distribution cible, la plupart ne contraignent pas celle-ci à être une distribution. Ainsi, un modèle appris à partir d’un nombre fini d’exemples peut renvoyer des valeurs négatives et qui ne somment pas à un.Ainsi, cette thèse s’adresse à ces deux problèmes en proposant 1) un élargissement des garanties théoriques pour les modèles compressés et 2) de nouveaux algorithmes d’apprentissage ne souffrant pas du problème des probabilités négatives et dont certains bénéficient de garanties PAC. Une application en guerre électronique est aussi proposée pour le séquencement des écoutes du récepteur superhétéordyne

Thèses en Ligne

INRIA a CCSD electronic archive server

HAL Descartes

Hal-Diderot

Développement durable et responsabilité sociétale : de la contradiction au dépassement

Author: Brodhag Christian
Publication venue: HAL CCSD
Publication date: 19/03/2009
Field of study

http://www.emse.fr/aslc2009/pdf/textes%20pour%20les%20actes%202.pdfNational audienceIl est classique de présenter le développement durable comme un oxymore, une contradiction dans les termes environnement et développement. En nous appuyant sur la théorie de la négociation nous pouvons au contraire le concevoir comme une valeur nouvelle issue d'une sorte de " négociation coopérative " environnement/développement (Aurélien Boutaud114). Cette négociation a été orchestrée par les Nations Unies (rapport Brundtland 1987) et validée politiquement à Rio en 1992. Cette valeur nouvelle permet un dépassement de la contradiction. Elle rajoute un modèle coopératif à un modèle dominant fondé sur la seule compétition : on recherche systématiquement une approche triplement gagnante dans les domaines économique, social et environnemental.

HAL Descartes

Hal-Diderot

HAL-EMSE

Représentation des connaissances scientifiques en vue de leur transfert vers l'industrie (Application à la valorisation des produits à base de bois en fin de vie)

Author: IRLE Mark
JMAL Aymen
Publication venue
Publication date: 01/01/2013
Field of study

La thèse s intéresse au transfert de connaissances scientifiques en valorisation des produits à base de bois en fin de vie vers les acteurs de la filière bois. La question de recherche est : Comment transférer les connaissances scientifiques (recueil et représentation des connaissances) sur la valorisation des produits à base de bois en fin de vie pour qu'elles puissent être assimilées et utilisées par les acteurs de la filière bois ? Le recueil des connaissances a combiné des séances d'interview de spécialistes avec l acquisition des connaissances à partir d articles scientifiques. Les connaissances recueillies ont été reformulées afin de faciliter leur transfert vers les acteurs de la filière bois : les concepts pertinents, relations d'influence entre les concepts et résultats scientifiques ont été respectivement représentés via des cartes conceptuelles, graphes d'influence, et fiches de connaissances. Un modèle canonique de cartes conceptuelles a été proposé afin de permettre une représentation homogène des concepts. La transmission, l assimilation et l'utilisation potentielle des connaissances à transférer ont été traitées comme suit : La transmission a été proposée via un livre électronique (hypermédia) de connaissances, L assimilation a été prise en compte via la reformulation des connaissances et une représentation graphique des connaissances suivant une carte conceptuelle canonique et un format prédéfini de fiches. L utilisation potentielle des connaissances transférées a été renforcée par la représentation des leviers d'action sur les concepts du domaine sous forme de graphes d'influence. Les performances de transfert à partir du livre ont été évaluées en fonction du degré de compréhension du contenu du livre, la charge cognitive de l utilisateur au cours de l utilisation du livre de connaissances et sa désorientation. L expérience a montré que la forme canonique développée est intuitive ; et, tout comme la navigation dans le livre, n'occasionne pas de désorientation ou surcharge cognitive de l'utilisateur. Les résultats obtenus montrent, au sein de la filière bois, tout l intérêt de la représentation proposée pour le transfert de connaissances scientifiques vers des professionnels.This thesis focuses on the transfer of scientific knowledge on recovered wood to practitioners of the wood sector. The research question is: how to transfer the scientific knowledge (collect and representation of knowledge and the transmission medium) on the recovered wood so that they may assimilate and used by non-scientific personnel of the wood sector ? Knowledge was first collected through interviews with specialists in the re-use of recovered wood and combined with acquisition of knowledge from scientific publications. The collected knowledge was then reformulated to facilitate its transfer to practitioners in the wood sector. The relevant concepts, the influences between concepts and relevant scientific results werere spectively represented via concept maps, influence graphs, and knowledge sheets. A canonical model of concept maps is proposed to enable a homogeneous representation of concepts. Transmission, assimilation and potential utilization of knowledge transfer were treated as follows : The transmission is proposed via an electronic (hypermedia) knowledge-book, the assimilation (absorption) has been taken into account through the reformulation of knowledge and a graphical representation of knowledge following a canonical concept map and sheets with a predefined format and The potential use of the transferred knowledge is facilitated by the representation of the action levers on the domain concepts in the form of influence graphs. The efficiency of knowledge transfer via the knowledge book has been evaluated according to the degree of understanding of the book content, the cognitive load of the user during use of the knowledge-book and the disorientation it caused. The experience has shown that the developed canonical form is intuitive and, like navigation in the book, does not cause disorientation or cognitive over load to the user. This promotes the assimilation and the use of the knowledge-book content. The obtained results indicate that the representation of relevant knowledge in a knowledge-book should facilitate for the transfer of scientific knowledge to professionals in the wood sector.NANTES-ENS Mines (441092314) / SudocSudocFranceF

OpenGrey Repository

TOTh 2007 : Terminologie et Ontologie : Théories et Applications. Annecy 1er Juin 2007

Author: Roche Christophe
Publication venue: HAL CCSD
Publication date: 01/06/2007
Field of study

National audienceProceedings of the TOTh 2007 Conference: Terminology and Ontology: Theories and Applications. Annecy, France 1st June 200

Hal - Université Grenoble Alpes

HAL Université de Savoie

Vers une vision systémique du processus de l'explication : récit d'une recherche sur l'intégration de la pédagogie, de l'ingénierie et de la modélisation

Author: Rosca Ioan
Publication venue
Publication date: 01/01/1999
Field of study

Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal

Dépôt Institutionnel Numérique

Développement des algorithmes pour l’automatisation de la classification des données utilisant les réseaux de neurones probabilistes (PNN). Application à l’analyse, la catégorisation et la cartographie des images de télédétection.

Author: IOUNOUSSE Jawad
Publication venue: HAL CCSD
Publication date: 12/09/2015
Field of study

The main topic of this thesis is modeling and classification for analyzing and processing digital data. Our objective is the realization of a set of algorithms to automate data classification using probabilistic neural networks (PNN). The considered data are remote sensing images.We propose a novel procedure for automatic classification based on PNN. We used unsupervised methods to search for classes in the learning phase; we built a function to validate classes inspired from fuzzy clustering techniques and we adapted our procedure to be applied on multidimensional data such as satellite images. Before applying this approach toremote sensing images, we conducted a series of tests on various types of synthetic and real data. These tests have produced very convincing results in comparison to usual unsupervised methods.We applied our algorithm in order to build land cover maps from satellite images. So, we have to analyze high spatial resolution images representing the study area for identifying all existing vegetation patterns. The classification is applied on sequence of NDVI time series data derived from satellite images. The aim is to test all of the developed algorithms on realcases to highlight their performance. These tests have demonstrated once again that the proposed approaches are entirely capable to produce successful classification. In semi-arid regions such as the region of Marrakech Tensift El Haouz, mapping land cover contributes extremely in evapotranspiration flow estimation used for water management.Le thème principal de cette thèse est la modélisation et la classification pour l’analyse et le traitement de l’information contenue dans les données numériques. Notre contribution est la réalisation d’un ensemble d’algorithmes pour l’automatisation de la classification des données en utilisant les réseaux de neurones probabilistes (PNN). Les données considérées sont les images de télédétection. Cette thèse s’adresse non seulement aux numériciens et spécialistes du traitement des images, mais aussi aux chercheurs et praticiens dans plusieurs domaines tels que la télédétection qui utilisent la classification des données en général et l’analyse de l’information pour la modélisation en particulier. Nous proposons une nouvelle procédure de classification automatique fondée sur les PNN. Nous avons utilisé des méthodes non supervisées pour la recherche des classes à la phase de l’apprentissage. Nous avons construit une fonction pour la validité des classes en s’inspirant des techniques de classification automatique floue. Nous avons aussi adapté notre procédure pour l’application sur des données multidimensionnelles telles que les images satellitaires. Avant d’appliquer cette approche sur des images de télédétection, nous avons mené une série de tests sur plusieurs types de données synthétiques et réelles. Ces tests ont abouti à des résultats très convaincants en comparaison avec les méthodes non superviséesusuelles, ce qui a conduit à valider la performance de nos algorithmes. Dans la partie application à la télédétection, l’objectif est d’élaborer des cartes d’occupation du sol à partir des images satellitaires. Nous avons analysé les images à haute résolution spatiale représentant la région étudiée pour identifier tous les profils de végétation existants. La classification est menée en se basant sur les images de l’indice de végétation NDVI extraites des images satellitaires SPOT. L’objet à classifier est une série temporelle de sept scènes NDVI. Le but est de tester l’ensemble des algorithmes développés sur des cas réels pour mettre en évidence leur performance. Ces tests ont démontré encore une fois de plus que les approches proposées sont tout à fait aptes à produire une classificationperformante.Nous avons classifié et analysé les images satellitaires d’une région semi-aride de Marrakech Tensift El Haouz. Le résultat obtenu est une cartographie précise de l’occupation du sol. Ce résultat contribuera d’une façon importante dans le dressage des cartes du flux d’évapotranspiration pour établir un bilan hydrique de la région

Thèses en Ligne

La définition du terme «mot» en grammaire française contemporaine : une approche par la sémantique lexico-grammaticale

Author: Parent François
Publication venue
Publication date: 23/04/2018
Field of study

Cette thèse approfondit la notion de mot qui a cours en grammaire française contemporaine. Plus précisément, elle fait ressortir les problèmes qui découlent du fait d’employer un concept relevant de la pensée commune (le mot) pour élaborer une explication scientifique du langage. Elle examine la manière dont les linguistes exploitent cette notion dans la tradition grammaticale et dans trois courants théoriques marquant la linguistique moderne (structuralisme, fonctionnalisme, générativisme); elle évalue également les stratégies employées par ces approches pour régler les problèmes posés par la définition et l’emploi du concept de mot dans la description linguistique. Comme voie de résolution de ces problèmes, elle propose la notion de morpholexème, qui correspond à l’unité significative associant en permanence un signifié lexical à un signifié grammatical, de manière à former une unité qui se ramènent dans l’ensemble aux unités considérées comme faisant partie des classes de mots variables, qui correspondent à environ 97 % du lexique du français.This thesis examines the concept of word used in contemporary French grammar. Specifically, it highlights issues which stem from using a concept belonging to ordinary language (the word) to develop a scientific explanation of human language. It investigates how linguists exploit this notion in the grammatical tradition and in three theoretical currents which have made their mark in modern linguistics (structuralism, functionalism, generativism). It also assesses the strategies used by these approaches to solve the problems related to the definition and usage of the concept of word in the linguistic description. To address these issues, it proposes the concept of morpholexeme, which corresponds to a linguistic unit permanently combining a lexical meaning and a grammatical meaning, as a basis for identifying a homogenous category corresponding to morphologically variable words, a category covering close approximately 97 % of the French lexicon

CorpusUL

Le modèle flot de données appliqué à la synthèse haut-niveau pour le traitement d’images sur caméra intelligente à base de FPGA. Application aux systèmes d’apprentissage supervisés

Author: Bourrasset Cédric
Publication venue: HAL CCSD
Publication date: 09/02/2016
Field of study

High-level synthesis is a field of research that aims to automate the transformation from an high-level algorithmic description to a register level representation for its implementation on a digital circuit. Most of existing tools based on imperative languages try to provide a general solution to any type of existing algorithm. This approach can be inefficient in some applications where the algorithm description relies on a different paradigm from the hardware execution model. This major drawback can be figured out by the use of specific langages, named Domain Specific Language (DSL). Applied to the image processing field, the dataflow model appears as a good compromise between the expressiveness of the algorithm description and the final implementation efficiency. This thesis address the use of the dataflow programming model as response to high-level synthesis problematics for image processing algorithms on FPGA. To demonstrate the effectiveness of the proposed method but also to put forth the algorithmic reformulation effort to be made by the developer, an ambitious class of applications was chosen : supervised machine learning systems. It will be addressed in particular two algorithms, a classification system based on Support Vector Machine and a convolutional neural network. Experiments will be made with the CAPH langage, a specific HLS tool based on the dataflow programming model.La synthèse de haut niveau (High Level Synthesis (HLS)) est un domaine de recherche qui vise à automatiser le passage de la description d’un algorithme à une représentation au niveau registre de celui-ci en vue de son implantation sur un circuit numérique. Si le problème reste à ce jour largement ouvert pour des algorithmes quelconques, des solutions ont commencé à voir le jour au sein de domaines spécifiques. C’est notamment le cas dans le domaine du traitement d’images où l’utilisation du modèle flot de données offre un bon compromis entre expressivité et efficacité. C’est ce que nous cherchons à démontrer dans cette thèse, qui traite de l’applicabilité du modèle flot de données au problème de la synthèse haut niveau à travers deux exemples d’implantation d’applications de vision complexes sur FPGA. Les applications, issues du domaine de l’apprentissage supervisé sont un système de classification à bases de machines à vecteurs supports (SVM) et un système de reconnaissance exploitant un réseau de neurones convolutionnels (CNN). Dans les deux cas, on étudie les problématiques posées par la reformulation, au sein du modèle flot de données, des structures de données et algorithmes associés ainsi que l’impact de cette reformulation sur l’efficacité des implémentations résultantes. Les expérimentations sont menées avec CAPH, un outil de HLS exploitant le modèle flot de données

Thèses en Ligne

HAL Clermont Université

Hal-Diderot