47 research outputs found

    Application de techniques parcimonieuses et hiérarchiques en reconnaissance de la parole

    Get PDF
    Les systèmes de reconnaissance de la parole sont fondamentalement dérivés des domaines du traitement et de la modélisation statistique des signaux. Depuis quelques années, d'importantes innovations de domaines connexes comme le traitement d'image et les neurosciences computationnelles tardent toutefois à améliorer la performance des systèmes actuels de reconnaissance de parole. La revue de la littérature a suggéré qu'un système de reconnaissance vocale intégrant les aspects de hiérarchie, parcimonie et grandes dimensions joindrait les avantages de chacun. L'objectif général est de comprendre comment l'intégration de tous ces aspects permettrait d'améliorer la robustesse aux bruits additifs d'un système de reconnaissance de la parole. La base de données TI46 (mots isolés, faible-vocabulaire) est utilisée pour effectuer l'apprentissage non-supervisé et les tests de classification. Les différents bruits additifs proviennent de la base de données NOISEX-92, et permettent d'évaluer la robustesse en conditions de bruit réalistes. L'extraction de caractéristiques dans le système proposé est effectuée par des projections linéaires successives sur des bases, permettant de couvrir de plus en plus de contexte temporel et spectral. Diverses méthodes de seuillage permettent de produire une représentation multi-échelle, binaire et parcimonieuse de la parole. Au niveau du dictionnaire de bases, l'apprentissage non-supervisé permet sous certaines conditions l'obtention de bases qui reflètent des caractéristiques phonétiques et syllabiques de la parole, donc visant une représentation par objets d'un signal. L'algorithme d'analyse en composantes indépendantes (ICA) s'est démontré mieux adapté à extraire de telles bases, principalement à cause du critère de réduction de redondance. Les analyses théoriques et expérimentales ont montré comment la parcimonie peut contourner les problèmes de discrimination des distances et d'estimation des densités de probabilité dans des espaces à grandes dimensions. Il est observé qu'un espace de caractéristiques parcimonieux à grandes dimensions peut définir un espace de paramètres (p.ex. modèle statistique) de mêmes propriétés. Ceci réduit la disparité entre les représentations de l'étage d'extraction des caractéristiques et celles de l'étage de classification. De plus, l'étage d'extraction des caractéristiques peut favoriser une réduction de la complexité de l'étage de classification. Un simple classificateur linéaire peut venir compléter un modèle de Markov caché (HMM), joignant une capacité de discrimination accrue à la polyvalence d'une segmentation en états d'un signal. Les résultats montrent que l'architecture développée offr de meilleurs taux de reconnaissance en conditions propres et bruités comparativement à une architecture conventionnelle utilisant les coefficients cepstraux (MFCC) et une machine à vecteurs de support (SVM) comme classificateur discriminant. Contrairement aux techniques de codage de la parole où la transformation doit être inversible, la reconstruction n'est pas importante en reconnaissance de la parole. Cet aspect a justifié la possibilité de réduire considérablement la complexité des espaces de caractéristiques et de paramètres, sans toutefois diminuer le pouvoir de discrimination et la robustesse

    La poursuite auditive du mouvement acoustique vers l'acquisition des catégories phonétiques

    Get PDF
    Cette thèse explore le développement de la parole chez l'enfant durant la première année de vie. Elle vise précisément à caractériser le mécanisme à la base de l'acquisition des catégories phonétiques. Les nombreuses recherches dans le domaine offrent un portrait compréhensible de la trajectoire développementale de la perception de la parole. Les mécanismes de ce développement demeurent toutefois mal compris, particulièrement en ce qui a trait aux stratégies de l'enfant pour faire face au problème de la variabilité. En s'inspirant des théories de l'invariance chez l'adulte et sur la base de données empiriques chez l'enfant, cette thèse présente trois études visant à soutenir l'hypothèse selon laquelle la poursuite auditive du mouvement acoustique sous-tend l'acquisition des catégories phonétiques. Tout d'abord, deux études de modélisation simulent l'acquisition d'un type particulier de catégories phonétiques, les tons lexicaux, par le biais de réseaux neuronaux artificiels de type non supervisé. Ces simulations évaluent l'impact de diverses sources de variabilité et l'efficacité du mouvement acoustique sur la catégorisation des tons en chinois mandarin. Les résultats montrent que malgré un degré modéré de variabilité, les patrons de fréquence fondamentale présentent des régularités permettant de distinguer les quatre tons mandarins, sans information préalable quant au nombre de catégories à découvrir. Ceci suggère que le signal acoustique continu peut suffire à l'acquisition des tons lexicaux, sans besoin de faire appel à un ensemble de propriétés phonétiques abstraites. En présence de multiples sources de variabilité cependant, l'information spectrale du signal de surface n'entretient qu'une faible relation avec les sons de la parole recherchés. À l'opposé, l'information dynamique (les profils de vélocité de la fréquence fondamentale) permet d'atteindre un niveau de performance comparable à celui de l'adulte pour l'identification des tons. De plus, les quatre profils de vélocité découverts par le réseau neuronal correspondent aux quatre tons mandarins et permettent de caractériser les gestes invariants impliqués dans la production tonale. Afin de vérifier si l'enfant peut faire usage de cette stratégie dynamique pour normaliser le signal de la parole, une étude comportementale examine ensuite la capacité d'enfants préverbaux à percevoir des variations acoustiques reflétant une contrainte articulatoire. Une procédure de regard préférentiel est utilisée afin de vérifier si des enfants de 4 et 8 mois peuvent distinguer entre eux des patrons d'intonation possibles et impossibles sur le plan articulatoire et produits par un locuteur inconnu. Les résultats montrent que les enfants des deux groupes d'âge écoutent plus longuement les stimuli possibles, indiquant qu'ils peuvent détecter des variations subtiles de vélocité de la fréquence fondamentale et préfèrent les variations qui respectent la contrainte articulatoire. Ces résultats suggèrent qu'en bas âge déjà, les enfants peuvent calculer la première dérivée d'informations spectrales continues et réduire la variabilité interlocuteur à partir de la dynamique du signal acoustique. Le modèle proposé par les études de simulations permet d'établir l'efficacité de l'information dynamique dans le développement phonétique. L'étude comportementale permet pour sa part de vérifier la sensibilité à cette information chez l'enfant en bas âge. Ces résultats suggèrent que l'invariance se situe à la fois au niveau acoustique/auditif, moteur et développemental, et que la poursuite auditive du mouvement acoustique reflétant les gestes articulatoires représente une stratégie efficace pour l'acquisition des catégories phonétiques. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Catégories phonétiques, Apprentissage distributionnel, Perception de la parole, Production de la parole, Acquisition du langage, Réseaux neuronaux artificiels non-supervisé

    Modélisation de la dépendance contextuelle des concepts flous la structure SFC

    Get PDF
    Ces dernières années, l’intelligence artificielle a connu une évolution rapide grâce à de nouvelles approches comme, par exemple, la logique floue. Les systèmes flous sont en effet, venus combler des niches importantes dans plusieurs applications de contrôle et de décision. Malgré ses succès, la logique floue a toutefois rapidement atteint ses limites du fait qu’on n’ait pas tenu compte de l’effet du contexte. Dans un contexte particulier, l’homme a, en effet, la capacité d’utiliser adéquatement des représentations floues. Dans le cas d’un système flou, si le contexte change, ce dernier ne peut pas s’adapter puisqu’il a été conçu dans certaines conditions particulières. Ce problème, maintes fois soulevé, a pourtant été très peu abordé dans les recherches. Le présent travail a permis d'identifier les raisons de cette indifférence dans le domaine du raisonnement flou. Compte tenu de ses implications complexes au niveau cognitif, plusieurs domaines ont été abordés, entre autres, ceux de la linguistique, de la psychologie cognitive, de l’intelligence artificielle, de la théorie des connaissances et des théories de mémorisation. Ces études interdisciplinaires ont contribué à déduire les lignes essentielles d’une modélisation de l’effet contextuel. La proposition est une structure cognitive désignée sous l’acronyme SFC dont les mécanismes simulent le raisonnement humain envers la dépendance contextuelle. L’approche est structuraliste du fait qu’elle inclut des modules internes comportant différentes fonctionnalités et responsabilités. Ces modules interagissent hiérarchiquement dans le traitement de l’information floue sous l’efiet du contexte. En ce qui concerne les représentations des connaissances, l’approche englobe l’ensemble de l’information : les connaissances à traiter doivent contenir implicitement ou explicitement l’information provenant du contexte. L’effet du contexte constitue donc, en lui-même, une information à traiter et à mémoriser. De ce point de vue, les connaissances sont intégrées à leur contexte. L’exemple de la conduite automatique d’une voiture vient valider la structure SFC. Une structure simplifiée appelée SFC-R a récemment été proposée; outre de pouvoir être utilisée dans les systèmes flous à grande échelle, cette dernière peut également servir à réduire la dimension des bases des règles à grande échelle et à intégrer efficacement l’information, même discrète, dans une base floue.Abstract: During the last years, artificial intelligence evolved rapidly by the introduction of some innovative approaches and theories such as fuzzy logic. Fuzzy systems have filled some important niches in several applications of control, decision, etc. Despite these successes, fuzzy logic has confronted rapidly its limitations by the lack of processing the effect of context. Human is capable to decide adequately fuzzy representations in particular contexts. Nevertheless a fuzzy system, once conceived by an expert, is non-adaptable to conditions that change under the effect of context. This problem has been addressed by several researchers; however, very few have touched it. In this research, it has been first identified the reasons of such an indifference in fuzzy reasoning. By complex implications at the cognitive level, several areas such as linguistics, cognitive psychology, artificial intelligence, the theory of knowledge and of memory and memorisation have been studied. These interdisciplinary studies helped to deduce essentials of such a model of contextual effect. Consequently, a cognitive structure named SFC is proposed. This structure contains internal mechanisms simulating human reasoning under contextual dependence. Proposed approach is structuralist by the fact of including internal modules, each one having different functionality and responsibilities. These modules interact hierarchically to process fuzzy information under the effect of context. As of representing knowledge, the approach assumes integrity at the level of information: knowledge to process has to contain, implicitly or explicitly, the information of context. Consequently, the effect of context is itself an information to process and to memorise. Under this viewpoint, knowledge is integrated to its context. The SFC structure is validated by an automatic conduct example of a car. Finally, a simplified structure named SFC-R that can be used in large-scale fuzzy systems is proposed. This structure is not only useful to reduce dimension in large scale rule bases, but also to integrate, in a very efficient manner, the discreet information in fuzzy rule bases

    Extraction de phrases parallèles à partir d’un corpus comparable avec des réseaux de neurones récurrents bidirectionnels

    Full text link
    Les corpus parallèles sont cruciaux pour le bon fonctionnement des applications multilingues du traitement automatique du langage naturel. Comme ils sont des ressources essentielles, le nombre limité de corpus parallèles, que nous trouvons pour un nombre relativement faible de paires de langues sur très peu de domaines spécifiques, est problématique pour le développement des applications de traitement automatique du langage naturel. L'extraction de phrases parallèles est une tâche qui s'attaque directement au problème de manque de données en extrayant des phrases parallèles depuis l'importante quantité d'articles multilingues retrouvés sur le Web. Dans ce mémoire, nous proposons un système d'extraction de phrases parallèles qui mesure la relation de traduction entre les phrases dans deux langues. Notre système est une approche basée sur des réseaux de neurones récurrents bidirectionnels qui peut apprendre les représentations des phrases dans un espace vectoriel conjoint en maximisant explicitement la similarité entre les phrases parallèles. Contrairement aux approches précédentes, en exploitant ces représentations vectorielles continues des phrases nous enlevons le besoin d'utiliser plusieurs modèles et toute ingénierie de traits spécifiques. Notre approche s'entraîne directement avec des paires de phrases et s'adapte facilement à une grande quantité de données. Des expériences sur des corpus parallèles bruités montrent que notre approche surpasse un système de référence à l'état de l'art. Pour justifier l'utilité de notre approche, nous ajoutons les paires de phrases extraites des articles de Wikipédia à un corpus parallèle pour entraîner des systèmes de traduction automatique et nous obtenons une amélioration de la performance de traduction. Nos résultats empiriques nous amènent à croire que notre système est un outil prometteur pour créer de nouvelles ressources multilingues alignées.Parallel corpora are a prerequisite for many multilingual natural language processing applications. As they are an invaluable resource, the limited amount of parallel data, which is only available for a relatively small number of language pairs on very few specific domains, is problematic for scaling natural language processing applications. Parallel sentence extraction is a task addressing the data sparsity problem by extracting parallel sentences from the increasing amount of content-related multilingual articles on the World Wide Web. In this thesis, we propose a parallel sentence extraction system to measure the translational equivalence between sentences in two languages. Our system is a bidirectional recurrent neural network based approach that can learn sentence representations in a shared vector space by explicitly maximizing the similarity between parallel sentences. In contrast to previous approaches, by leveraging these continuous vector representation of sentences we remove the need to rely on multiples models and any specific feature engineering. Our approach can be efficiently trained with raw sentence pairs and is scalable to large amount of data. Experiments on noisy parallel corpora show that our approach outperforms a state-of-the-art baseline. To justify the utility of our approach, we add the sentence pairs extracted from Wikipedia articles to a parallel corpus to train machine translation systems and show improvement in translation performance. Our experimental results lead us to believe that our system is a promising tool to create new aligned multilingual resources

    Exploration des réseaux de neurones à base d'autoencodeur dans le cadre de la modélisation des données textuelles

    Get PDF
    Depuis le milieu des années 2000, une nouvelle approche en apprentissage automatique, l'apprentissage de réseaux profonds (deep learning), gagne en popularité. En effet, cette approche a démontré son efficacité pour résoudre divers problèmes en améliorant les résultats obtenus par d'autres techniques qui étaient considérées alors comme étant l'état de l'art. C'est le cas pour le domaine de la reconnaissance d'objets ainsi que pour la reconnaissance de la parole. Sachant cela, l’utilisation des réseaux profonds dans le domaine du Traitement Automatique du Langage Naturel (TALN, Natural Language Processing) est donc une étape logique à suivre. Cette thèse explore différentes structures de réseaux de neurones dans le but de modéliser le texte écrit, se concentrant sur des modèles simples, puissants et rapides à entraîner

    Les signatures neurobiologiques de la conscience

    Get PDF
    Dans le cadre de ses activités scientifiques, l’Académie Européenne Interdisciplinaire des Sciences a réuni durant la période 2016-2018, par l’intermédiaire de séminaires, conférences et colloque, divers spécialistes travaillant dans les domaines des neurosciences, de la psychologie cognitive, de l’intelligence artificielle, ou encore réfléchissant aux impacts sociétaux des avancées obtenues. Cet ouvrage est le fruit de toutes ces contributions et a pour ambition de présenter un certain nombre de résultats, de perspectives actuellement discernables, de points de vue concernant l’état des connaissances dans ces domaines avec un lien, parfois direct, parfois implicite, avec la question de la conscience. Une introduction générale, rédigée par le comité de lecture de l’AEIS, rappelle le contexte de l’émergence de ces résultats, perspectives et points de vue, dont le lecteur prendra connaissance dans le corps de l’ouvrage, qui comporte quatre parties : Travaux en neurosciences et psychologie expérimentale. Sciences cognitives et intelligence artificielle. Réflexions sur l’intelligence, la conscience et l’impact de l’IA sur les activités humaines. Synthèse des discussions de la table ronde tenue à l’issue du colloque de mars 2018. Un court épilogue rédigé par le comité de lecture met en avant des réflexions et questions qu’ont soulevé la lecture des différents chapitres de l’ouvrage et la prise de connaissance d’articles scientifiques foisonnants sur les travaux actuels pluridisciplinaires autour des interrogations liées à la conscience au sens large

    Géomatique et géographie de l'environnement. De l'analyse spatiale à la modélisation prospective

    Get PDF
    Le présent mémoire retrace notre parcours géomatique de géographe de l'environnement, en le situant d'abord dans le champ scientifique avant de résumer les principales approches en modélisation et en simulation prospective applicables dans ce domaine. Sur ces bases, nous présentons le modèle géomatique de simulation prospective de l'occupation du sol que nous avons établi, avant de conclure en ouvrant des perspectives de recherches. Dans la première partie, le positionnement scientifique de la géomatique fait l'objet des 2 premiers chapitres qui analysent l'émergence de ce nouveau champ transdisciplinaire et ses relations avec la géographie. La seconde partie est consacrée à la modélisation et à la simulation prospective de dynamiques environnementales. Dans une dernière partie, plus brève, nous concluons ce mémoire en esquissant quelques perspectives. Perspectives de développement des recherches en matière de modélisation d'abord, mais aussi de thématiques environnementales que nous souhaitons approfondir. Enfin sont suggérées quelques pistes sur la valorisation de nos recherches et les nouveaux enjeux de la formation géomatique en géographie. Un second fascicule complète le premier et fait état, outre le curriculum vitae, de nos activités professionnelles et publications

    La philosophie naturelle d'Aristote et le problème contemporain de l'inscription corporelle de l'esprit

    Get PDF
    En raison du progrès soutenu des sciences expérimentales et des technologies de l’information, plusieurs chercheurs en neurosciences affirment que nous sommes plus près que jamais de montrer la façon dont la physiologie et l’organisation du cerveau produisent les fonctions supérieures du système nerveux. Ainsi, des scientifiques de renom ont commencé à formuler des hypothèses, à construire des théories et à développer des modèles de simulation numérique en vue d’expliquer l’apparition de la conscience à partir des mécanismes de signalisation neuronale et de la modification adaptative des circuits nerveux cérébraux. Les philosophes aussi cherchent maintenant à formuler la solution au problème de l’explication de l’unité du corps et de l’esprit sur les bases de ces connaissances. Mais étant donné que cette approche implique la compréhension des phénomènes mentaux en termes de phénomènes physiques, leur réflexion conduit, en général, soit à une description réductionniste de l’esprit, soit à un dualisme de propriétés. C’est pourquoi certains d’entre eux ont proposé récemment de chercher dans la philosophie naturelle d’Aristote la direction que devrait emprunter cette recherche. Pourtant, plusieurs des arguments avancés par ces savants contemporains à l’appui de leurs thèses comportent des erreurs de principe, de compréhension ou de méthode qui mettent sérieusement en doute la solidité de leurs propositions. Cette recherche analyse en détail ces arguments dans le dessein de faire ressortir les principales difficultés et de les enlever pour juger d’une façon plus éclairée de la vraie contribution de ces connaissances à notre compréhension de l’unité naturelle que forment le corps et l’esprit. Sa démarche se divise en trois étapes principales. La première vise à prendre connaissance de l’état actuel de la recherche expérimentale en neurobiologie, la deuxième évalue deux modèles représentatifs de la recherche théorique des neurosciences et la troisième se propose de parvenir à comprendre le plus exactement possible la façon dont Aristote rend compte de l’unité du corps et de l’esprit. Trois observations générales résultent de cet examen. Premièrement, qu’en réalité la neurobiologie ne cherche pas à comprendre l’aspect phénoménal des fonctions supérieures du cerveau, mais uniquement leurs fondements neuraux, car elle est consciente de ses limites naturelles en tant que science expérimentale. Deuxièmement, que les arguments avancés par ces modèles théoriques de la conscience en faveur de la compréhension biologique des fonctions supérieures du système nerveux se servent principalement de l’altération du sens des mots du vocabulaire associé à la cognition pour accomplir le passage des phénomènes biologiques aux phénomènes mentaux, proposant essentiellement de comprendre ces derniers comme le résultat d’une inférence statistique accomplie par la signalisation neuronale grâce à la structuration adaptative des circuits nerveux. Troisièmement, que la philosophie naturelle d’Aristote accomplit réellement l’unité du corps et de l’esprit, mais qu’elle ne parvient pas à expliquer cette unité à partir des mécanismes de la perception et du mouvement de l’animal, mais plutôt à partir des principes qui fondent son étude de la nature, et que les objections formulées à ses arguments découlent d’une lecture fragmentaire ou biaisée de ses écrits et d’une compréhension superficielle ou erronée de ses concepts fondamentaux de sa philosophie. Ces observations permettent de conclure que la tâche de la philosophie de la nature n’est pas celle d’accommoder sa réflexion concernant l’unité que forment ensemble le corps, l’âme et l’esprit aux résultats des sciences expérimentales, mais celle de formuler des principes aptes à unifier les différents aspects de la réalité sur lesquels portent ces différentes sciences.The steady progress of experimental science and information technologies has led several researchers in the neurosciences to affirm that we are now closer than ever to disclosing the way in which the physiological organisation of the brain produces the higher functions of the nervous system. Consequently, these renowned scientists have proposed hypotheses, elaborated theories and developed numerical simulation models in order to explain the emergence of consciousness from the mechanics of neural signaling and the adaptation of the brain’s neural circuits. Philosophers are currently also seeking the solution to the problem of explaining the unity of body and mind on the basis of this knowledge. But as this approach implies describing mental phenomena in terms of the underlying physical phenomena, their reflections generally lead either to a reductionist description of the mind or to a dualist theory. For this reason, certain of them have recently proposed that such research should look for inspiration in the natural philosophy of Aristotle. However, several of the arguments advanced by these contemporary researchers in the support of their theses are flawed by errors of principle, of comprehension or of method, which place serious doubt upon the solidity of their propositions. In the present dissertation these arguments are placed under detailed scrutiny in order to pinpoint the main difficulties and discard them, allowing a clearer evaluation of the true contribution of these propositions to our understanding of the natural unity formed by body and the mind. This project is divided into three major sections. The first is intended to present the current state of experimental research in neurobiology; the second evaluates two representative models from current theoretical research in neuroscience; and the third endeavours to come to as exact an understanding as possible of the way in which Aristotle treats the unity of the body and the soul, to which the intellect v i belongs in the particular case of man and whose concept does not exactly match the contemporary concept of mind. There are three general observations that can be drawn from this examination. Firstly, in reality neurobiology does not seek to explain the phenomenal aspects of the brain’s higher functions, only their neurological bases, because as an experimental science it is bound by natural limits. Secondly, the arguments put forth by theoretical models of consciousness in favour of a biological understanding of the higher neurological functions are mainly based on the alteration of the meaning of words associated with cognition in order to make the transition from biological to mental phenomena. These phenomena would then be understood essentially as the result of statistical inference accomplished by neuronal signaling, made possible by the adaptive restructuring of neural circuits. Thirdly, Aristotle’s natural philosophy truly succeeds in uniting body and soul, but his explanation of this unity is not founded on the mechanisms of perception and movement in the animal, but rather on the principles underlying his study of nature, and the objections that have been raised against his arguments have been based on fragmentary or biased readings of his writings, and on an erroneous or superficial understanding of the fundamental concepts of his philosophy. These observations allow us to draw the conclusion that the proper task of the philosophy of nature is not to accommodate its reflections concerning the unity of body, soul and spirit to the results of experimental science, but rather that of formulating the principles that unify the different aspects of reality upon which the different sciences are based
    corecore