5 research outputs found

    Nouvelles techniques de segmentation pour caractériser le timbre vocal d'un locuteur en vue de la vérification automatique de l'identité

    Get PDF
    Dans ce travail de recherche nous avons développé de nouvelles techniques de segmentation fréquentielle caractérisant l'empreinte vocale en vu de l'authentification de l'identité du locuteur. Nous avons proposé un nouvel algorithme MSAAB (Meilleure Structure d'Arbre ABstrait) impliquant une analyse en ondelettes et une analyse en composante principale. À partir d'un signal vocal d'un locuteur donné, nous pouvons déterminer les paramètres acoustiques appropriés qui lui permettent d'être discriminant. En utilisant l'algorithme MSAAB, nous avons effectué une série d'expériences pour la vérification de l'identité par la voix en mode texte-dépendent et en mode texte-indépendant. Durant nos expériences, nous avons utilisé deux types de corpus: Yoho, une base de données propre et Spidre, une base de données téléphonique bruitée. Les paramètres extraits sont utilisés comme une entrée du système de vérification d'identité. Celui-ci utilise une modélisation Markovienne. Les résultats obtenus ont été comparés avec d'autres types de paramètres, Fourier notamment. La robustesse des algorithmes proposés a pu être vérifiée et confirmée

    Utilisation de la transformée de Fourier et de la transformée en ondelettes pour la reconnaissance du locuteur

    Get PDF
    Ce travail porte sur l'utilisation de la transformée en ondelettes pour la vérification du locuteur en mode de texte dépendant. Nous avons étudié deux approches dans le cadre de ce sujet: (a) La première est basée sur l'utilisation de la méthode MFDWC (Mel Frequency Discrete Wavelet Coefficients) faisant usage des filtres de Daubechies d'ordres fixe, et d'ordres adaptés au sens de certains critères d'entropies. (b) La deuxième approche est basée sur l'utilisation de l'algorithme de sélection de la meilleure base d'ondelettes au sens du critère d'entropie de Shannon non normalisé. Nous avons proposé dans le cadre de cette approche un algorithme de construction du meilleur arbre du locuteur. Nous avons nommé cet algorithme MAL (Meilleur arbre du locuteur). Cette méthode permet de construire une librairie d'arbres admissibles à partir des phrases d'entraînement. Chaque arbre admissible correspond à un locuteur. Nous avons testé les performances de reconnaissance en effectuant des expériences sur (60) locuteurs. Ces derniers sont extraits de la base de données de Yoho. Finalement, les résultats des deux méthodes ont été comparés avec ceux de la méthode MFCC (Mel Frequency Cepstral Coefficient)

    Étude de quelques méthodes de détection d'activité vocale dans des environnements industriels bruités

    Get PDF
    Le travail proposé est la mise au point d'un détecteur d'activité vocale (DAV) performant pour une utilisation dans des milieux industriels bruités. Pour cela, deux approches ont été abordées. La première a consisté à modifier un DAV existant afin de l'adapter à ce type d'environnement, la plupart de ceux proposés dans la littérature ayant été développés pour les télécommunications. Le DAV du codeur de parole G729 a donc été adapté aux milieux industriels. Les performances obtenues sont intéressantes. La deuxième approche, elle, est basée sur la théorie des ondelettes. Nos recherches nous ont permis d'aboutir à un nouvel algorithme: le DAV INNES. Il repose sur deux notions fondamentales: la décomposition en paquets d'ondelettes selon l'échelle de Mel et la prise de décision en fonction des valeurs du Paramètre du Seuil de Johnstone et Silverman et des énergies. Les résultats obtenus sont très satisfaisants

    Analyses et traitements : de l’imagerie ultrasonore médicale aux séries temporelles biomédicales

    Get PDF
    Dans ce manuscrit, les activités de recherche méthodologiques concernent principalement l’imagerie ultrasonore médicale au sens large et les séries temporelles biomédicales. Ces deux thématiques distinctes (n’y cherchez donc aucun lien) seront présentées à tour de rôle dans les parties relatives à mes activités de recherche passées et en cours. Dans la deuxième partie, je présenterai d’abord "l’imagerie Doppler". Toutefois, au lieu d’y présenter d’emblée la méthodologie puis les applications, j’ai préféré mettre l’accent sur deux applications médicales : les monitorings Doppler transcrâniens et transplacentaires. Cette présentation possède l’avantage de permettre un suivi instantané des avancées méthodologiques (Estimation, détection, classification) au détriment d’un seul et même fil conducteur méthodologique. Ce choix délibéré souligne qu’historiquement mes activités méthodologiques étaient d’abord guidées par les applications. Avec le temps, j’ai modifié cet équilibre pour placer finalement le "Signal" au centre de mes activités scientifiques. Je commencerai par présenter l’analyse spectrale qui a joué un rôle fondamental dans les applications ultrasonores. Dans la troisième partie, je présenterai mes nouvelles activités de recherche. Le premier volet, qui s’est étendue transversalement, s’appuie sur l’analyse des séries temporelles. Le second volet correspond à une extension naturelle des techniques mises en place en imagerie Doppler à l’imagerie ultrasonore échographique (avec et sans contraste). La quatrième partie, qui relate mes activités actuelles et à venir, constitue mes perspectives de recherche à moyen terme. Les thématiques abordées poursuivent et complètent les thématiques précédemment présentées en imagerie ultrasonore médicale et en analyse des séries temporelles biomédicales. En imagerie échographique et en imagerie de contraste, le fil conducteur méthodologique est un mélange subtil entre la déconvolution et la commande optimale. Finalement je présenterai des méthodes géométriques originales qui s’appuient sur les notions de symétrie, de récurrences et de corrélation

    "L’alternance de codes entre L1-fulfulde et L2-français dans l’enseignement bilingue du Burkina Faso : des technologies d’analyse linguistique de corpus oraux aux problématiques didactiques"présentée par Inoussa GUIRE sous la direction de Christophe PARISSE

    Get PDF
    This research aims at describing the current practice of code-switching in oral interaction in bilingual classes of Burkina Faso and didactical problems linked to this practice in a perspective of improvement. By a process of corpus linguistics, language tools, CLAN and Praat, are adapted to our bilingual context investigations on the basis of formal and functional theories of linguistics. For three years, 20h 36mn of movies of classroom activities and interviews were collected. The corpus has considered sequences of language arts classes and non-language subjects in all school classes we visited. After a standardized transcription with the CLAN software, specific codings suited to our theoretical orientation have been added to the software. Praat, a phonetic and acoustic analysis software, was associated to analyse pupils phonic difficulties. Quantitatively, the use of L1 and L2 tends to adhere to the official guidelines of the overall percentages of use of French and local languages. Qualitatively, the results of the analysis of inter-sentential, intra-sentential and extra-sentential code-switching highlight the linguistic, discursive, and didactic (for teachers) and acquisitional (for pupils) functions. Proposals for improvements were made. All hypotheses on pupils and teachers discourse, and on the software, have been tested.Cette recherche a pour objectif la description outillée de la pratique actuelle de l’alternance codique dans l’interaction orale en classe bilingue au Burkina Faso et de la problématique didactique liée à cette pratique dans une perspective d’amélioration. Dans une démarche de la linguistique de corpus, les outils linguistiques CLAN et Praat sont réadaptés aux investigations en contexte bilingue sur la base des théories formelle et fonctionnelle de la linguistique. Sur trois ans, 20h 36mn de films constitués de séquences de classes et d’entretiens ont été collectées. Le corpus a pris en compte des séquences des cours de disciplines linguistiques et de disciplines non linguistiques dans toutes les classes des écoles visitées. Après une transcription standardisée avec le logiciel CLAN, des codages spécifiques à notre orientation théorique ont été ajoutés à ce logiciel. Le logiciel Praat d’analyse phonétique et acoustique a été associé pour cerner les difficultés phoniques des élèves. De façon générale, au niveau quantitatif, l’emploi de L1 et de L2 tend à suivre les orientations globales officielles du pourcentage d’utilisation du français et des langues locales. Au niveau qualitatif, les résultats font ressortir, de l’analyse de l’alternance codique en interphrastique, en intraphrastique et en extraphrastique, les fonctions linguistiques, discursives, didactiques (chez les enseignants) et acquisitionnelles (chez les élèves). Des propositions d’amélioration des pratiques de classe ont été apportées. Toutes les hypothèses, sur le discours des élèves, des enseignants et sur les logiciels, ont été mises à l’épreuv
    corecore