19 research outputs found
Amélioration psychoacoustique du filtrage de Wiener : quelques approches récentes et une nouvelle méthode
*Bruit musical, distorsion, filtre deWiener, psychoacoustique, signal de parol
From non parametric statistics to speech denoising
International audienceGiven some signal additively corrupted by independent white Gaussian noise with unknown standard deviation σ,we present a new estimator ofσ. This estimator derives from a theoretical result presented and commented in the paper. Without any preliminary signal detection, the esti-mate is performed on the basis of the time-frequency components returned by a standard spectrogram where the Discrete Fourier Transform is simply weighted by the square window. No assumption about the signal statistics is made.The signal time-frequency components are assumed to have probabilities of presence less than or equal to one half.This estimator is suited to speech denoising. It avoids the use of any Voice Activity Detector and is an alternative solution to subspace approaches. Objective performance measurements show that the standard Wiener filtering of speech signals can be tuned with the outcome of this es-timator without a significant loss in comparison with the measurements obtained when the noise standard deviation is know
Débruitage perceptuel de la parole
Depuis une dizaine d année, l investigation des méthodes de débruitage de la parole a permis d atteindre des résultats spectaculaires. Cependant, certaines problématiques et questions restent ouvertes. Une de ces problématiques est de parvenir à un compromis entre la réduction du bruit, la distorsion du signal et le bruit résiduel et musical. L essor des méthodes basées sur des notions perceptuelles, essentiellement le phénome ne de masquage fréquentiel, a suscité beaucoup d intéret ces dernières décennies. L objectif de base des filtres perceptuels est de réduire le bruit sans apporter plus de distorsion sur le signal de parole. L une des façcons d éviter des distorsions superflues est alors d opérer uniquement dans les fréquences où le bruit est perceptuellement significatif. Cependant, en procédant ainsi, le bruit initialement inaudible, et par conséquent non pris en compte par le débruitage perceptuel, risque de devenir audible et genant si les masquants de ce bruit sont filtrés. C est ce que l on nomme dans cette thèse, le phénomène MAN (Maskee to Audible Noise). Les contributions majeures de cette thèse sont en premier lieu, de mettre en évidence ce phénomène qui, à notre connaissance, n a jamais encore été décrit et de montrer ses effets secondaires. Ensuite, nous proposons une approche élémentaire pour remédier au phénomène MAN grace à un double filtrage atténuant le bruit dans toutes les fréquences pour éviter la production de ce phénomène. Nous proposons une deuxième approche basée sur un filtre optimal, dit anti-MAN, au sens d un critère sélectif par zone de fréquence. A travers ce critère, nous définisssons la zone du phénomène MAN et pouvons ainsi atténuer le bruit y contribuant. Des évaluations comparatives sur des critères objectifs et subjectifs de qualité sont présentées pour plusieurs types de bruit et de rapport signal à bruit. Les résultats ont révélé la supériorité des méthodes proposées dans ce travail par rapport à des méthodes perceptuelles récentes ne considérant pas le phénomène MAN. Dans la suite expérimentale de ce travail, nous avons conçu deux systèmes de reconnaissance de la parole avec HTK (Hidden Markov Models) ; l un est basé sur des monophones et l autre sur des triphones. La phase d apprentissage de ces deux systèmes s est déroulée en absence du bruit ; ceci nous a permis d évaluer l impact du débruitage sur les performances de ces systèmes en présence de bruit. Les résultats montrent que les méthodes qui se distinguent par rapport à des critères objectifs et meme subjectifs ne sont pas forcément celles qui rendent les systèmes de reconnaissance plus robustes. Ces derniers sont généralement plus sensibles aux distorsions vu que le destinataire final est une machine.BREST-Télécom Bretagne (290192306) / SudocSudocFranceF
Algorithms and applications for estimating the standard deviation of AWGN when observations are not signal-free
International audienceConsider observations where random signals are randomly present or absent in independent and additive white Gaussian noise (AWGN). By using a recently established limit theorem, we introduce a new estimator for the estimation of the noise standard deviation when the signals are less present than absent and have unknown probability distributions. The bias, the consistency and the minimum attainable mean square estimation error of the estimator we propose are still unknown. However, the experimental results that are presented are very promising. First, when the Minimum- Probability-of-Error decision scheme for the non-coherent detection of modulated sinusoidal carriers in independent AWGN is tuned with the outcome of our estimator instead of the true value of the noise standard deviation, the Binary Error Rate tends to the optimal error probability when the number of observations is large enough. Second, given some speech signal corrupted by independent AWGN, our estimator can be used to estimate the noise standard deviation so as to adjust the standard Wiener filtering of the noisy speech. The objective performance measurements obtained by so proceeding are very close to those achieved when the Wiener filtering is tuned with the true value of the noise standard deviation
Speech enhancement and psychoacoustics
International audienceThe purpose of this presentation is to describe why and how psychoacoustic models are used to design speech enhancement systems capable of improving speech intelligibility in presence of noise (for mobile communication applications, for instance) or capable of denoising sufficiently well noisy speech signals so as to improve the recognition rate of some automatic speech recognizer (for instance, robot monitoring in noisy environment, hand-free applications on board of vehicles, military fastjets and helicopters). To begin with, standard methods aimed at denoising speech signals are performed in the spectral domain without taking into account the perceptual characteristics of the speech signal to enhance. They succeed in improving the Signal to Noise Ratio (SNR) but return annoying and unpleasant residual noise known as musical noise. In the last few decades, psychoacoustic models have then attracted a great deal of interest. The objective is to improve the perceptual quality of the enhanced speech signal. The psychoacoustic model is used to control the enhancement process in order to find the best trade-off between noise reduction, residual noise and speech distortion. The masking phenomenon is the main human auditory system property which is used to design perceptually motivated speech enhancement systems
A new approach for semiparametric detection
International audienceSemiparametric detection consists of combining the statistical optimality of a parametric test to the robustness regarding the data of a nonparametric test. This approach is specially interesting in presence of statistical hypotheses depending on unknown probability distributions. The proposed semiparametric approach consists of splitting the measurement vector into two parts such that the first part has a known statistical distribution. Then, it is proposed to calculate a likelihood ratio test based both on the first part and the detection result of a nonparametric test applied to the second part. The statistical performance of the proposed test is analytically established
Amélioration psychoacoustique du filtrage de Wiener
Dans ce papier, on s'intéresse à la réduction du bruit de type musical qu'engendrent des méthodes basées sur la soustraction de bruit et en particulier, le filtrage de Wiener. On compare plusieurs méthodes qui introduisent des modifications perceptuelles de ce filtrage et on propose une nouvelle méthode qui améliore la qualité de la parole débruitée en sortie du filtre de Wiener usuel. Cette amélioration résulte d'un contrôle du filtre de Wiener par un second filtre qui peut être considéré comme un facteur de pondération perceptuelle