Search CORE

5 research outputs found

Détection de mots clés dans un flux de parole

Author: BEN AYED Yassine
CHOLLET Gérard
Publication venue
Publication date: 01/01/2003
Field of study

PARIS-Télécom ParisTech (751132302) / SudocNANCY-INRIA Lorraine LORIA (545472304) / SudocSudocFranceF

OpenGrey Repository

Détection de mots clés dans un flux de parole

Author: Ben Ayed Yassine
Publication venue: HAL CCSD
Publication date: 23/12/2003
Field of study

Membre du Jury: André-Obrecht, Régine et De Mori, Renato et Fohr, Dominique et Jouvet, Denis et Carré, RenéLa reconnaissance automatique de la parole suscite actuellement un grand intérêt. En particulier, la détection de mots clés qui constitue une branche importante de l'interaction homme-machine vu le besoin de communiquer avec nos machines d'une façon naturelle et directe en utilisant la parole spontanée. Cette technique consiste à détecter dans une phrase prononcée, les mots clés caractérisant l'application et de rejeter les mots hors-vocabulaire ainsi que les hésitations, les faux départs etc.Le travail que nous présentons dans ce manuscrit s'inscrit dans le cadre de la détection de mots clés dans un flux de parole. Tout d'abord, nous proposons de nouveaux modèles ``poubelles'' fondés sur la modélisation des mots hors-vocabulaire. Puis nous introduisons la reconnaissance à base de boucle de phonèmes, dans laquelle nous appliquons différentes fonctions de récompense favorisant la reconnaissance des mots clés.Ensuite nous proposons l'utilisation des mesures de confiance afin de pouvoir prendre la décision de rejeter ou d'accepter un mot clé hypothèse. Les différentes mesures de confiance proposées sont basées sur la probabilité d'observation acoustique locale. En premier lieu, nous utilisons les moyennes arithmétique, géométrique et harmonique comme mesures de confiance pour chaque mot clé. En second lieu, nous proposons de calculer la mesure de confiance en se basant sur la méthode à base de boucle de phonèmes. Enfin nous présentons le problème de détection comme un problème de classification où chaque mot clé peut appartenir à deux classes différentes, à savoir ``correct'' et ``incorrect''. Cette classification est réalisée en utilisant des Support Vector Machines (SVM) qui constituent une nouvelle technique d'apprentissage statistique. Chaque mot clé reconnu est représenté par un vecteur caractéristique qui constitue l'entrée du classifieur SVM. Pour déterminer ce vecteur, nous utilisons la probabilité d'observation acoustique locale et nous introduisons ensuite la durée de chaque état. Afin d'améliorer les performances, nous proposons des approches hybrides combinant les modèles poubelles avec mesure de confiance et mesure de confiance avec SVM.Pour tester les performances de l'ensemble de ces modèles nous utilisons la base de données française SPEECHDAT. L'évaluation de tous les résultats a été réalisée en se basant sur les courbes ROC et les courbes rappel/précision. Les meilleurs résultats ont été obtenus par les méthodes basées sur l'utilisation des SVM. Les méthodes hybrides nous ont permis aussi de réaliser de bonnes performances

Thèses en Ligne

thèses en ligne de ParisTech

Détection de mots clés dans un flux de parole par les modèles de Markov cachés

Author: Benayed Yassine
Chollet Gérard
Fohr Dominique
Haton Jean-Paul
Publication venue: HAL CCSD
Publication date: 01/01/2002
Field of study

Rapport interne.Dans ce rapport, nous abordons le problème de la détection de mots clés dans un flux de parole et le rejet des entrées incorrectes.Nous proposons deux techniques différentes pour améliorer le rejet des mots hors-vocabulaire. La première est un modèle combiné qui utilise deux modèles ``poubelle'' (un modèle appris et un modèle déterminé au cours de la phase de reconnaissance). La deuxième est une méthode hybride basée sur un modèle "poubelle" appris et une mesure de confiance calculée pour chaque hypothèse de reconnaissance dans une étape de post-traitement.Ces deux approches sont évaluées dans un contexte d'une application boursière. Nous avons étudié ces deux techniques afin de trouver les valeurs des paramètres qui nous permettent d'améliorer le taux de reconnaissance

HAL-UJM

INRIA a CCSD electronic archive server

HAL-Rennes 1

Comparaison de différentes méthodes de classification pour la détection de mots clés en parole continue

Author: Benayed Yassine
Chollet Gérard
Fohr Dominique
Haton Jean-Paul
Publication venue: HAL CCSD
Publication date: 01/01/2004
Field of study

Colloque avec actes et comité de lecture. internationale.International audienceCet article s'inscrit dans le cadre de la détection de mots clés dans un flux de parole. Nous présentons le problème de détection comme un problème de classification où chaque mot clé peut appartenir à deux classes différentes, à savoir ``correct'' et ``incorrect''. Cette classification est réalisée tout d'abord, par l'utilisation des Réseaux de Neurones Artificiels (RNA) en particulier le Perceptron Multi-Couches (PMC). Ensuite, nous proposons l'utilisation des SVM comme technique de classification innovante et efficace et qui a fait ses preuves dans plusieurs domaines de recherche. Chaque mot clé reconnu est représenté par un vecteur caractéristique qui constitue l'entrée du classifieur. Pour déterminer ce vecteur, nous proposons trois représentations vectorielles basées sur l'emploi des probabilités d'observations acoustiques locales et de la durée de chaque éta

HAL-UJM

INRIA a CCSD electronic archive server

HAL-Rennes 1