Débruitage perceptuel de la parole

Abstract

Depuis une dizaine d année, l investigation des méthodes de débruitage de la parole a permis d atteindre des résultats spectaculaires. Cependant, certaines problématiques et questions restent ouvertes. Une de ces problématiques est de parvenir à un compromis entre la réduction du bruit, la distorsion du signal et le bruit résiduel et musical. L essor des méthodes basées sur des notions perceptuelles, essentiellement le phénome ne de masquage fréquentiel, a suscité beaucoup d intéret ces dernières décennies. L objectif de base des filtres perceptuels est de réduire le bruit sans apporter plus de distorsion sur le signal de parole. L une des façcons d éviter des distorsions superflues est alors d opérer uniquement dans les fréquences où le bruit est perceptuellement significatif. Cependant, en procédant ainsi, le bruit initialement inaudible, et par conséquent non pris en compte par le débruitage perceptuel, risque de devenir audible et genant si les masquants de ce bruit sont filtrés. C est ce que l on nomme dans cette thèse, le phénomène MAN (Maskee to Audible Noise). Les contributions majeures de cette thèse sont en premier lieu, de mettre en évidence ce phénomène qui, à notre connaissance, n a jamais encore été décrit et de montrer ses effets secondaires. Ensuite, nous proposons une approche élémentaire pour remédier au phénomène MAN grace à un double filtrage atténuant le bruit dans toutes les fréquences pour éviter la production de ce phénomène. Nous proposons une deuxième approche basée sur un filtre optimal, dit anti-MAN, au sens d un critère sélectif par zone de fréquence. A travers ce critère, nous définisssons la zone du phénomène MAN et pouvons ainsi atténuer le bruit y contribuant. Des évaluations comparatives sur des critères objectifs et subjectifs de qualité sont présentées pour plusieurs types de bruit et de rapport signal à bruit. Les résultats ont révélé la supériorité des méthodes proposées dans ce travail par rapport à des méthodes perceptuelles récentes ne considérant pas le phénomène MAN. Dans la suite expérimentale de ce travail, nous avons conçu deux systèmes de reconnaissance de la parole avec HTK (Hidden Markov Models) ; l un est basé sur des monophones et l autre sur des triphones. La phase d apprentissage de ces deux systèmes s est déroulée en absence du bruit ; ceci nous a permis d évaluer l impact du débruitage sur les performances de ces systèmes en présence de bruit. Les résultats montrent que les méthodes qui se distinguent par rapport à des critères objectifs et meme subjectifs ne sont pas forcément celles qui rendent les systèmes de reconnaissance plus robustes. Ces derniers sont généralement plus sensibles aux distorsions vu que le destinataire final est une machine.BREST-Télécom Bretagne (290192306) / SudocSudocFranceF

    Similar works

    Full text

    thumbnail-image

    Available Versions

    Last time updated on 14/06/2016