2 research outputs found

    Communication dans le bruit : perception de sa propre voix et rehaussement de la parole

    Get PDF
    La communication dans le bruit est un problĂšme de tous les jours pour les travailleurs qui oeuvrent dans des environnements industriels bruyants. Un grand nombre de travailleurs se plaignent du fait que leurs protecteurs auditifs les empĂȘchent de communiquer facilement avec leurs collĂšgues. Ils ont alors tendance Ă  retirer leurs protecteurs et mettent ainsi leur audition Ă  risque. Ce problĂšme de communication est en fait double : les protecteurs modifient Ă  la fois la perception de la propre voix du porteur, ainsi que la comprĂ©hension de la parole des autres personnes. Cette double problĂ©matique est considĂ©rĂ©e dans le cadre de cette thĂšse. La modification de la perception de la propre voix du porteur des protecteurs est en partie due Ă  l’effet d’occlusion qui se produit lorsque le conduit auditif est occlus par un bouchon d’oreille. Cet effet d’occlusion se traduit essentiellement par une amĂ©lioration de la perception des sons de basses frĂ©quences internes Ă  l’ĂȘtre humain (bruits physiologiques), et par une modification de la perception de la propre voix de la personne. Dans le but de mieux comprendre ce phĂ©nomĂšne, suite Ă  une Ă©tude approfondie de ce qui se trouve dĂ©jĂ  dans la littĂ©rature, une nouvelle mĂ©thode pour quantifier l’effet d’occlusion a Ă©tĂ© dĂ©veloppĂ©e. Au lieu d’exciter la boite crĂąnienne du sujet au moyen d’un pot vibrant ou de faire parler le sujet, comme il se fait classiquement dans la littĂ©rature, il a Ă©tĂ© dĂ©cidĂ© d’exciter la cavitĂ© buccale des sujets au moyen d’une onde sonore. L’expĂ©rience a Ă©tĂ© conçue de telle maniĂšre que l’onde sonore qui excite la cavitĂ© buccale n’excite pas l’oreille externe ou le reste du corps directement. La dĂ©termination des seuils auditifs en oreilles ouvertes et occluses a ainsi permis de quantifier un effet d’occlusion subjectif pour une onde sonore dans le conduit buccal. Ces rĂ©sultats ainsi que les autres quantifications d’effet d’occlusion prĂ©sentĂ©es dans la littĂ©rature ont permis de mieux comprendre le phĂ©nomĂšne de l’effet d’occlusion et d’évaluer l’influence des diffĂ©rents chemins de transmission entre la source sonore et l’oreille interne. La comprĂ©hension de la parole des autres personnes est altĂ©rĂ©e Ă  la fois par le fort niveau sonore prĂ©sent dans les environnements industriels bruyants et par l’attĂ©nuation du signal de parole due aux protecteurs auditifs. Une possibilitĂ© envisageable pour remĂ©dier Ă  ce problĂšme est de dĂ©bruiter le signal de parole puis de le transmettre sous le protecteur auditif. De nombreuses techniques de dÂŽebruitage existent et sont utilisĂ©es notamment pour dĂ©bruiter la parole en tĂ©lĂ©communication. Dans le cadre de cette thĂšse, le dĂ©bruitage par seuillage d’ondelettes est considĂ©rĂ©. Une premiĂšre Ă©tude des techniques “classiques” de dĂ©bruitage par ondelettes est rĂ©alisĂ©e afin d’évaluer leurs performances dans un environnement industriel bruyant. Ainsi les signaux de paroles testĂ©s sont altĂ©rĂ©s par des bruits industriels selon une large de gamme de rapports signal Ă  bruit. Les signaux dĂ©bruitĂ©s sont Ă©valuĂ©s au moyen de quatre critĂšres. Une importante base de donnĂ©es est ainsi obtenue et est analysĂ©e au moyen d’un algorithme de sĂ©lection conçue spĂ©cifiquement pour cette tĂąche. Cette premiĂšre Ă©tude a permis de mettre en Ă©vidence l’influence des diffĂšrents paramĂȘtres du dĂ©bruitage par ondelettes sur la qualitĂ© de celui-ci et ainsi de dĂ©terminer la mĂ©thode “classique” qui permet d’obtenir les meilleures performances en terme de qualitĂ© de dĂ©bruitage. Cette premiĂšre Ă©tude a Ă©galement permis de donner des guides pour la conception d’une nouvelle loi de seuillage adaptĂ©e au dĂ©bruitage de la parole par ondelettes dans un environnement industriel bruitĂ©. Cette nouvelle loi de seuillage est prĂ©sentĂ©e et Ă©valuĂ©e dans le cadre d’une deuxiĂšme Ă©tude. Ses performances se sont avĂ©rĂ©es supĂ©rieures Ă  la mĂ©thode “classique” mise en Ă©vidence dans la premiĂšre Ă©tude pour des signaux de parole dont le rapport signal Ă  bruit est compris entre −10 dB et 15 dB

    ENHANCEMENT OF SPEECH INTELLIGIBILITY USING SPEECH TRANSIENTS EXTRACTED BY A WAVELET PACKET-BASED REAL-TIME ALGORITHM

    Get PDF
    Studies have shown that transient speech, which is associated with consonants, transitions between consonants and vowels, and transitions within some vowels, is an important cue for identifying and discriminating speech sounds. However, compared to the relatively steady-state vowel segments of speech, transient speech has much lower energy and thus is easily masked by background noise. Emphasis of transient speech can improve the intelligibility of speech in background noise, but methods to demonstrate this improvement have either identified transient speech manually or proposed algorithms that cannot be implemented to run in real-time.We have developed an algorithm to automatically extract transient speech in real-time. The algorithm involves the use of a function, which we term the transitivity function, to characterize the rate of change of wavelet coefficients of a wavelet packet transform representation of a speech signal. The transitivity function is large and positive when a signal is changing rapidly and small when a signal is in steady state. Two different definitions of the transitivity function, one based on the short-time energy and the other on Mel-frequency cepstral coefficients, were evaluated experimentally, and the MFCC-based transitivity function produced better results. The extracted transient speech signal is used to create modified speech by combining it with original speech.To facilitate comparison of our transient and modified speech to speech processed using methods proposed by other researcher to emphasize transients, we developed three indices. The indices are used to characterize the extent to which a speech modification/processing method emphasizes (1) a particular region of speech, (2) consonants relative to, and (3) onsets and offsets of formants compared to steady formant. These indices are very useful because they quantify differences in speech signals that are difficult to show using spectrograms, spectra and time-domain waveforms.The transient extraction algorithm includes parameters which when varied influence the intelligibility of the extracted transient speech. The best values for these parameters were selected using psycho-acoustic testing. Measurements of speech intelligibility in background noise using psycho-acoustic testing showed that modified speech was more intelligible than original speech, especially at high noise levels (-20 and -15 dB). The incorporation of a method that automatically identifies and boosts unvoiced speech into the algorithm was evaluated and showed that this method does not result in additional speech intelligibility improvements
    corecore