26 research outputs found
Towards the integration of speech and natural language into human-computer interaction systems
This paper first surveys and classifies applications of voice humancomputer
dialogue. The advantages and limits of speech as a means of
communication between users and software are then considered .
A major problem in the development of user interfaces with a voice
component, besicles the choice of appropriate applications, is speech
recognition, especially continuons speech recognition .
As approaches differ according to the type of application, we first
summarize problems and techniques specific to voice data input ; as an
example, we briefly describe the speech recognition approach that we have
adopted for the dictation machine that we are developing in our Laboratory Then, the case of voice dialogue understanding and management is
considered. To illustraie the discussion, the architecture and functionalities
ofsome prototypes that we have implemented are presented :for instance,
an E-mail system and a Sonar control software . Finally, we present a
dialogue manager DIAL capable of helping/guiding the user in complex
cognitive activities that we are currently developing and implementing .Cet article se propose de dresser une synthèse et une classification des
diverses applications du dialogue oral homme-machine. Il présente, dans
une première partie, les avantages et les limites de la parole comme
moyen de communication entre un utilisateur et un système automatisé .
Le problème essentiel pour le développement d'interfaces utilisateur Ã
composante orale, à côté du choix d'applications appropriées, est la
reconnaissance de la parole, spécialement de la parole continue .
Comme les approches diffèrent suivant le type d'applications, nous
présentons tout d'abord les problèmes et les techniques spécifiques Ã
l'entrée orale de données et, à titre d'exemple, nous décrivons rapidement
l'approche que nous avons adoptée pour la machine à dicter que
nous développons dans notre laboratoire .
Ensuite nous abordons la compréhension et la gestion de dialogues
oraux . Pour illustrer cette présentation, nous présentons l'architecture et les fonctionnalités de divers prototypes que nous avons mis en ouvre
système de messagerie électronique, dialogue pour la commande d'une
console sonar et dialogue entre un chirurgien et un système d'aide au
diagnostic .
Enfin, nous détaillons le gestionnaire de dialogues DIAL, en cours de
développement, dont l'objectif est d'aider et de guider un utilisateur dans
des activités cognitives complexes telle la recherche de renseignements
administratifs
Acoustic-phonetic decoding of speech : problems and solutions
Acoustic phonetic decoding of speech recognition constitutes a major step
in the process of continuous speech recognition . This paper reminds the
difficulties of the problem together with the main methods proposed so far
in order to solve it . We then concentrate on the différent complementary
approaches Chat have been investigated by our group : expert system based
on spectrogram reading, recognition by phonetic triphones, connectionist model based on the cortical column unit and stochastic recognition without
segmentation .Le décodage acoustico-phonétique constitue une étape importante en
reconnaissance de la parole continue . Cet article rappelle d'abord les
difficultés du problème et les principales méthodes qui ont été proposées
pour le résoudre . Il présente ensuite les diverses approches complémentaires
adoptées par notre équipe : système expert fondé sur l'activité de
lecture de spectrogrammes, reconnaissance par triplets phonétiques,
modèle connexionniste de colonne corticale et reconnaissance par
méthode stochastique sans segmentation
Problems and solutions for noisy speech recognition
Automatic speech recognition has reached high level performances but it usually fails in coping with real-life, noisy environments. An essential reason is the mismatch between the conditions in which a system is trained and used. A large number of solutions have been proposed in order to solve this problem. Those solutions can be classified into two main, non exclusive categories. Firstly, signal processing and parametrization techniques can be used as a preprocessing step in order to enhance the SNR of the corrupted speech signal. Secondly, the different steps of the pattern matching process can be modified in order to account for the effects of noise. This paper presents a brief survey of the noisy speech recognition field. We first summarize the major difficulties that are encountered in the development of a system, and we then introduce three main categories of solutions dealing with acoustical preprocessing and parametrization of the speech signal, statistical modelling, and recognition techniques
Discriminative Phoneme Sequences Extraction for NonNative Speaker’s Origin Classification
In this paper we present an automated method for the classification of the origin of non-native speakers. The origin of non-native speakers could be identified by a human listener based on the detection of typical pronunciations for each nationality. Thus we suppose the existence of several phoneme sequences that might allow the classification of the origin of non-native speakers. Our new method is based on the extraction of discriminative sequences of phonemes from a non-native English speech database. These sequences are used to construct a probabilistic classifier for the speakers ’ origin. The existence of discriminative phone sequences in non-native speech is a significant result of this work. The system that we have developed achieved a significant correct classification rate of 96.3 % and a significant error reduction compared to some other tested techniques. 1
Le raisonnement en intelligence artificielle
International audienceFruit d'un travail d'enseignement et de recherche mené au Centre de Recherche en Informatique de Nancy (CRIN-CNRS/INRIA-Lorraine), cet ouvrage constitue l'une des premières présentations unifiées des divers modèles, techniques et architectures de raisonnement qui interviennent dans les systèmes à bases de connaissances.Après une introduction au domaine des systèmes à bases de connaissances dans le cadre général de l'intelligence Artificielle, ou I.A., les auteurs abordent la logique mathématique et ses liens avec le raisonnement, le raisonnement approximatif et incertain et les ensembles flous. Ils se consacrent ensuite au problème du temps dans les raisonnements et aux raisonnements hypothétique, qualitatif, par classification et analogique. Le dernier chapitre porte sur le raisonnement multi-agents dans le cadre de l'IA distribuée et prête une attention toute particulière au modèle de tableau noir.Constituant une référence précieuse pour comprendre et mettre en oeuvre les raisonnements nécessaires aux systèmes d'I.A. d'aujourd'hui et de demain, ce livre s'adresse aussi bien à l'ingénieur et au chef de projets amenés à développer de tels systèmes qu'au chercheur en I.A., à l'enseignant et à l'étudiant, de maîtrise ou de troisième cycle
Le raisonnement en intelligence artificielle
International audienceFruit d'un travail d'enseignement et de recherche mené au Centre de Recherche en Informatique de Nancy (CRIN-CNRS/INRIA-Lorraine), cet ouvrage constitue l'une des premières présentations unifiées des divers modèles, techniques et architectures de raisonnement qui interviennent dans les systèmes à bases de connaissances.Après une introduction au domaine des systèmes à bases de connaissances dans le cadre général de l'intelligence Artificielle, ou I.A., les auteurs abordent la logique mathématique et ses liens avec le raisonnement, le raisonnement approximatif et incertain et les ensembles flous. Ils se consacrent ensuite au problème du temps dans les raisonnements et aux raisonnements hypothétique, qualitatif, par classification et analogique. Le dernier chapitre porte sur le raisonnement multi-agents dans le cadre de l'IA distribuée et prête une attention toute particulière au modèle de tableau noir.Constituant une référence précieuse pour comprendre et mettre en oeuvre les raisonnements nécessaires aux systèmes d'I.A. d'aujourd'hui et de demain, ce livre s'adresse aussi bien à l'ingénieur et au chef de projets amenés à développer de tels systèmes qu'au chercheur en I.A., à l'enseignant et à l'étudiant, de maîtrise ou de troisième cycle
Towards an oral interface for data entry: The MAUD System
International audienceThis paper deals with use of MAUD as an oral interface for data entry and the description of the speech component of this system. The interface of MAUD has to combine voice-driven and keyboard dialogue in order to allow the user to use both keyboard and voice. The speech recognition system participated at the AUPELF-UREF evaluation of dictation machines. MAUD uses a vocabulary of 20 000 words. The mode of speech is continuous, and the language model was built with corpora of over than 48 million of words extracted from French newspapers