26 research outputs found

    Towards the integration of speech and natural language into human-computer interaction systems

    Get PDF
    This paper first surveys and classifies applications of voice humancomputer dialogue. The advantages and limits of speech as a means of communication between users and software are then considered . A major problem in the development of user interfaces with a voice component, besicles the choice of appropriate applications, is speech recognition, especially continuons speech recognition . As approaches differ according to the type of application, we first summarize problems and techniques specific to voice data input ; as an example, we briefly describe the speech recognition approach that we have adopted for the dictation machine that we are developing in our Laboratory Then, the case of voice dialogue understanding and management is considered. To illustraie the discussion, the architecture and functionalities ofsome prototypes that we have implemented are presented :for instance, an E-mail system and a Sonar control software . Finally, we present a dialogue manager DIAL capable of helping/guiding the user in complex cognitive activities that we are currently developing and implementing .Cet article se propose de dresser une synthèse et une classification des diverses applications du dialogue oral homme-machine. Il présente, dans une première partie, les avantages et les limites de la parole comme moyen de communication entre un utilisateur et un système automatisé . Le problème essentiel pour le développement d'interfaces utilisateur à composante orale, à côté du choix d'applications appropriées, est la reconnaissance de la parole, spécialement de la parole continue . Comme les approches diffèrent suivant le type d'applications, nous présentons tout d'abord les problèmes et les techniques spécifiques à l'entrée orale de données et, à titre d'exemple, nous décrivons rapidement l'approche que nous avons adoptée pour la machine à dicter que nous développons dans notre laboratoire . Ensuite nous abordons la compréhension et la gestion de dialogues oraux . Pour illustrer cette présentation, nous présentons l'architecture et les fonctionnalités de divers prototypes que nous avons mis en ouvre système de messagerie électronique, dialogue pour la commande d'une console sonar et dialogue entre un chirurgien et un système d'aide au diagnostic . Enfin, nous détaillons le gestionnaire de dialogues DIAL, en cours de développement, dont l'objectif est d'aider et de guider un utilisateur dans des activités cognitives complexes telle la recherche de renseignements administratifs

    Acoustic-phonetic decoding of speech : problems and solutions

    Get PDF
    Acoustic phonetic decoding of speech recognition constitutes a major step in the process of continuous speech recognition . This paper reminds the difficulties of the problem together with the main methods proposed so far in order to solve it . We then concentrate on the différent complementary approaches Chat have been investigated by our group : expert system based on spectrogram reading, recognition by phonetic triphones, connectionist model based on the cortical column unit and stochastic recognition without segmentation .Le décodage acoustico-phonétique constitue une étape importante en reconnaissance de la parole continue . Cet article rappelle d'abord les difficultés du problème et les principales méthodes qui ont été proposées pour le résoudre . Il présente ensuite les diverses approches complémentaires adoptées par notre équipe : système expert fondé sur l'activité de lecture de spectrogrammes, reconnaissance par triplets phonétiques, modèle connexionniste de colonne corticale et reconnaissance par méthode stochastique sans segmentation

    Problems and solutions for noisy speech recognition

    No full text
    Automatic speech recognition has reached high level performances but it usually fails in coping with real-life, noisy environments. An essential reason is the mismatch between the conditions in which a system is trained and used. A large number of solutions have been proposed in order to solve this problem. Those solutions can be classified into two main, non exclusive categories. Firstly, signal processing and parametrization techniques can be used as a preprocessing step in order to enhance the SNR of the corrupted speech signal. Secondly, the different steps of the pattern matching process can be modified in order to account for the effects of noise. This paper presents a brief survey of the noisy speech recognition field. We first summarize the major difficulties that are encountered in the development of a system, and we then introduce three main categories of solutions dealing with acoustical preprocessing and parametrization of the speech signal, statistical modelling, and recognition techniques

    0 - Editorial

    No full text

    Discriminative Phoneme Sequences Extraction for NonNative Speaker’s Origin Classification

    Get PDF
    In this paper we present an automated method for the classification of the origin of non-native speakers. The origin of non-native speakers could be identified by a human listener based on the detection of typical pronunciations for each nationality. Thus we suppose the existence of several phoneme sequences that might allow the classification of the origin of non-native speakers. Our new method is based on the extraction of discriminative sequences of phonemes from a non-native English speech database. These sequences are used to construct a probabilistic classifier for the speakers ’ origin. The existence of discriminative phone sequences in non-native speech is a significant result of this work. The system that we have developed achieved a significant correct classification rate of 96.3 % and a significant error reduction compared to some other tested techniques. 1

    Nonparametric distance measures of speaker verification

    No full text

    Le raisonnement en intelligence artificielle

    No full text
    International audienceFruit d'un travail d'enseignement et de recherche mené au Centre de Recherche en Informatique de Nancy (CRIN-CNRS/INRIA-Lorraine), cet ouvrage constitue l'une des premières présentations unifiées des divers modèles, techniques et architectures de raisonnement qui interviennent dans les systèmes à bases de connaissances.Après une introduction au domaine des systèmes à bases de connaissances dans le cadre général de l'intelligence Artificielle, ou I.A., les auteurs abordent la logique mathématique et ses liens avec le raisonnement, le raisonnement approximatif et incertain et les ensembles flous. Ils se consacrent ensuite au problème du temps dans les raisonnements et aux raisonnements hypothétique, qualitatif, par classification et analogique. Le dernier chapitre porte sur le raisonnement multi-agents dans le cadre de l'IA distribuée et prête une attention toute particulière au modèle de tableau noir.Constituant une référence précieuse pour comprendre et mettre en oeuvre les raisonnements nécessaires aux systèmes d'I.A. d'aujourd'hui et de demain, ce livre s'adresse aussi bien à l'ingénieur et au chef de projets amenés à développer de tels systèmes qu'au chercheur en I.A., à l'enseignant et à l'étudiant, de maîtrise ou de troisième cycle

    Le raisonnement en intelligence artificielle

    No full text
    International audienceFruit d'un travail d'enseignement et de recherche mené au Centre de Recherche en Informatique de Nancy (CRIN-CNRS/INRIA-Lorraine), cet ouvrage constitue l'une des premières présentations unifiées des divers modèles, techniques et architectures de raisonnement qui interviennent dans les systèmes à bases de connaissances.Après une introduction au domaine des systèmes à bases de connaissances dans le cadre général de l'intelligence Artificielle, ou I.A., les auteurs abordent la logique mathématique et ses liens avec le raisonnement, le raisonnement approximatif et incertain et les ensembles flous. Ils se consacrent ensuite au problème du temps dans les raisonnements et aux raisonnements hypothétique, qualitatif, par classification et analogique. Le dernier chapitre porte sur le raisonnement multi-agents dans le cadre de l'IA distribuée et prête une attention toute particulière au modèle de tableau noir.Constituant une référence précieuse pour comprendre et mettre en oeuvre les raisonnements nécessaires aux systèmes d'I.A. d'aujourd'hui et de demain, ce livre s'adresse aussi bien à l'ingénieur et au chef de projets amenés à développer de tels systèmes qu'au chercheur en I.A., à l'enseignant et à l'étudiant, de maîtrise ou de troisième cycle

    Towards an oral interface for data entry: The MAUD System

    Get PDF
    International audienceThis paper deals with use of MAUD as an oral interface for data entry and the description of the speech component of this system. The interface of MAUD has to combine voice-driven and keyboard dialogue in order to allow the user to use both keyboard and voice. The speech recognition system participated at the AUPELF-UREF evaluation of dictation machines. MAUD uses a vocabulary of 20 000 words. The mode of speech is continuous, and the language model was built with corpora of over than 48 million of words extracted from French newspapers
    corecore