36 research outputs found

    Binaural Integrated Active Noise Control and Noise Reduction in Hearing Aids

    Get PDF
    International audienceThis paper presents a binaural approach to integrated active noise control and noise reduction in hearing aids and aims at demonstrating that a binaural setup indeed provides significant advantages in terms of the number of noise sources that can be compensated for and in terms of the causality margins

    Effective Binaural Multi-Channel Processing Algorithm for Improved Environmental Presence

    Get PDF
    Binaural noise-reduction algorithms based on multi-channel Wiener filter (MWF) are promising techniques to be used in binaural assistive listening devices. The real-time implementation of the existing binaural MWF methods, however, involves challenges to increase the amount of noise reduction without imposing speech distortion, and at the same time preserving the binaural cues of both speech and noise components. Although significant efforts have been made in the literature, most developed methods so far have focused only on either the former or latter problem. This paper proposes an alternative binaural MWF algorithm that incorporates the non-stationarity of the signal components into the framework. The main objective is to design an algorithm that would be able to select the sources that are present in the environment. To achieve this, a modified speech presence probability (SPP) and a single-channel speech enhancement algorithm are utilized in the formulation. The resulting optimal filter also avoids the poor estimation of the second-order clean speech statistics, which is normally done by simple subtraction. Theoretical analysis and performance evaluation using realistic recorded data shows the advantage of the proposed method over the reference MWF solution in terms of the binaural cues preservation, as well as the noise reduction and speech distortion

    User-Symbiotic Speech Enhancement for Hearing Aids

    Get PDF

    Enhancement by postfiltering for speech and audio coding in ad-hoc sensor networks

    Full text link
    Enhancement algorithms for wireless acoustics sensor networks~(WASNs) are indispensable with the increasing availability and usage of connected devices with microphones. Conventional spatial filtering approaches for enhancement in WASNs approximate quantization noise with an additive Gaussian distribution, which limits performance due to the non-linear nature of quantization noise at lower bitrates. In this work, we propose a postfilter for enhancement based on Bayesian statistics to obtain a multidevice signal estimate, which explicitly models the quantization noise. Our experiments using PSNR, PESQ and MUSHRA scores demonstrate that the proposed postfilter can be used to enhance signal quality in ad-hoc sensor networks

    Speech enhancement in binaural hearing protection devices

    Get PDF
    The capability of people to operate safely and effective under extreme noise conditions is dependent on their accesses to adequate voice communication while using hearing protection. This thesis develops speech enhancement algorithms that can be implemented in binaural hearing protection devices to improve communication and situation awareness in the workplace. The developed algorithms which emphasize low computational complexity, come with the capability to suppress noise while enhancing speech

    Multi-channel dereverberation for speech intelligibility improvement in hearing aid applications

    Get PDF

    Algoritmo adaptativo de redução de ruído e preservação das diferenças de nível interaural para aparelhos auditivos

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2017.Aparelhos auditivos binaurais consistem em um par de aparelhos que compartilham e processam os sinais sonoros que recebem em seus microfones. Decorrente disto, estes dispositivos podem explorar pistas binaurais de localização das fontes acústicas. Isto permite o desenvolvimento de técnicas de redução de ruído para processar os sinais recebidos com o intuito de criarem uma percepção mais verossímil do cenário acústico para o usuário de aparelhos auditivos. Neste sentido, uma técnica bastante utilizada em aparelhos binaurais é o filtro de Wiener multicanal (MWF ? Multichannel Wiener filter). Os coeficientes do MWF determinam um estimador linear para o sinal desejado de fala. Este estimador preserva as pistas binaurais de localização da fala e altera, contudo, as do ruído aditivo. Por esta razão, várias técnicas foram desenvolvidas com a finalidade de preservar as pistas binaurais do ruído. Algumas destas técnicas baseiam-se na extensão da função custo do erro quadrático médio através de um termo derivado a partir da definição matemática da pista de localização binaural denominada diferença de intensidade interaural (ILD ? Interaural leveld diference). Entretanto, a determinação dos coeficientes ótimos que minimizam estas funções custo requer o uso de técnicas de otimização numérica, o que pode acarretar em tempos de processamento e/ou recursos computacionais inadmissíveis em aplicações em tempo real. Diante disto, este trabalho propõe um algoritmo adaptativo para redução de ruído e preservação da ILD do sinal de ruído. O método proposto determina os coeficientes dos filtros lineares de forma iterativa, o que representa uma mudança de paradigma e uma redução de custo computacional em relação à técnicas anteriores. Para os cenários acústicos avaliados, o algoritmo desenvolvido diminui em 6,96 dB a métrica de preservação da ILD do ruído, tendo um aumento de apenas 0,98 dB na métrica de preservação da ILD da fala em relação ao MWF. As métricas de qualidade de fala, redução de ruído e inteligibilidade se mantém aproximadamente as mesmas no ouvido mais distante da fonte de ruído. Adicionalmente, resultados subjetivos mostram que o método proposto preserva a percepção da localização da fonte de ruído próximo de sua posição original.Abstract : Binaural hearing aids are two devices which share and process the signals received in their microphones. Consequently, these devices can explore binaural localisation cues. This results in the development of noise reduction techniques which process the received signals to create a reliable perception of the acustic scenario for the hearing impaired person. In this sense, the techniques based on the multichannel Wiener filter (MWF) are extensivily used in applications of binaural hearing aids. The MWF coefficients produce a linear estimator of the desired speech component. This estimator preserves the speech binaural cues, and shifts the cues of the additive noise. Because of this, many techniques have been developed aiming to preserve the noise localisation cues. Some of that are based in the extension of the mean squared error cost function using a perceptualy motivated term based on the mathematical expresion of a binaural localization cue called interaurallevel difference (ILD). However, the technique uses numerical optimization approches to calculate the coefficients of linear noise reduction filters. Considering a real time application, this may result in unacceptable processing time and/or computational resources. For this reason, this work presents an adaptive algorithm for both noise reduction and preservation of noise ILDs. The proposed method calculates de linear filters using recursive equation which results in a reduction of the computacional cost with respect to the previews techniques. In the assessed acustic scenario, the method leads to a reduction of the noise ILD preservation measurement of up to 6.96 dB, and to an increase of just 0.98 dB in speech ILD preservation measurement, with respect to the MWF. The measures of speech quality, noise reduction and intelligibility are kept approximately the same in the ear in the opposite side of the noise source. In addition, subjective experiments show the proposed technique preserves the noise position perception near of the original noise source

    Speech enhancement algorithms for audiological applications

    Get PDF
    Texto en inglés y resumen en inglés y españolPremio Extraordinario de Doctorado de la UAH en el año académico 2013-2014La mejora de la calidad de la voz es un problema que, aunque ha sido abordado durante muchos años, aún sigue abierto. El creciente auge de aplicaciones tales como los sistemas manos libres o de reconocimiento de voz automático y las cada vez mayores exigencias de las personas con pérdidas auditivas han dado un impulso definitivo a este área de investigación. Esta tesis doctoral se centra en la mejora de la calidad de la voz en aplicaciones audiológicas. La mayoría del trabajo de investigación desarrollado en esta tesis está dirigido a la mejora de la inteligibilidad de la voz en audífonos digitales, teniendo en cuenta las limitaciones de este tipo de dispositivos. La combinación de técnicas de separación de fuentes y filtrado espacial con técnicas de aprendizaje automático y computación evolutiva ha originado novedosos e interesantes algoritmos que son incluidos en esta tesis. La tesis esta dividida en dos grandes bloques. El primer bloque contiene un estudio preliminar del problema y una exhaustiva revisión del estudio del arte sobre algoritmos de mejora de la calidad de la voz, que sirve para definir los objetivos de esta tesis. El segundo bloque contiene la descripción del trabajo de investigación realizado para cumplir los objetivos de la tesis, así como los experimentos y resultados obtenidos. En primer lugar, el problema de mejora de la calidad de la voz es descrito formalmente en el dominio tiempo-frecuencia. Los principales requerimientos y restricciones de los audífonos digitales son definidas. Tras describir el problema, una amplia revisión del estudio del arte ha sido elaborada. La revisión incluye algoritmos de mejora de la calidad de la voz mono-canal y multi-canal, considerando técnicas de reducción de ruido y técnicas de separación de fuentes. Además, la aplicación de estos algoritmos en audífonos digitales es evaluada. El primer problema abordado en la tesis es la separación de fuentes sonoras en mezclas infra-determinadas en el dominio tiempo-frecuencia, sin considerar ningún tipo de restricción computacional. El rendimiento del famoso algoritmo DUET, que consigue separar fuentes de voz con solo dos mezclas, ha sido evaluado en diversos escenarios, incluyendo mezclas lineales y binaurales no reverberantes, mezclas reverberantes, y mezclas de voz con otro tipo de fuentes tales como ruido y música. El estudio revela la falta de robustez del algoritmo DUET, cuyo rendimiento se ve seriamente disminuido en mezclas reverberantes, mezclas binaurales, y mezclas de voz con música y ruido. Con el objetivo de mejorar el rendimiento en estos casos, se presenta un novedoso algoritmo de separación de fuentes que combina la técnica de clustering mean shift con la base del algoritmo DUET. La etapa de clustering del algoritmo DUET, que esta basada en un histograma ponderado, es reemplazada por una modificación del algoritmo mean shift, introduciendo el uso de un kernel Gaussiano ponderado. El análisis de los resultados obtenidos muestran una clara mejora obtenida por el algoritmo propuesto en relación con el algoritmo DUET original y una modificación que usa k-means. Además, el algoritmo propuesto ha sido extendido para usar un array de micrófonos de cualquier tamaño y geometría. A continuación se ha abordado el problema de la enumeración de fuentes de voz, que esta relacionado con el problema de separación de fuentes. Se ha propuesto un novedoso algoritmo basado en un criterio de teoría de la información y en la estimación de los retardos relativos causados por las fuentes entre un par de micrófonos. El algoritmo ha obtenido excelente resultados y muestra robustez en la enumeración de mezclas no reverberantes de hasta 5 fuentes de voz. Además se demuestra la potencia del algoritmo para la enumeración de fuentes en mezclas reverberantes. El resto de la tesis esta centrada en audífonos digitales. El primer problema tratado es el de la mejora de la inteligibilidad de la voz en audífonos monoaurales. En primer lugar, se realiza un estudio de los recursos computacionales disponibles en audífonos digitales de ultima generación. Los resultados de este estudio se han utilizado para limitar el coste computacional de los algoritmos de mejora de la calidad de la voz para audífonos propuestos en esta tesis. Para resolver este primer problema se propone un algoritmo mono-canal de mejora de la calidad de la voz de bajo coste computacional. El objetivo es la estimación de una mascara tiempo-frecuencia continua para obtener el mayor parámetro PESQ de salida. El algoritmo combina una versión generalizada del estimador de mínimos cuadrados con un algoritmo de selección de características a medida, utilizando un novedoso conjunto de características. El algoritmo ha obtenido resultados excelentes incluso con baja relación señal a ruido. El siguiente problema abordado es el diseño de algoritmos de mejora de la calidad de la voz para audífonos binaurales comunicados de forma inalámbrica. Estos sistemas tienen un problema adicional, y es que la conexión inalámbrica aumenta el consumo de potencia. El objetivo en esta tesis es diseñar algoritmos de mejora de la calidad de la voz de bajo coste computacional que incrementen la eficiencia energética en audífonos binaurales comunicados de forma inalámbrica. Se han propuesto dos soluciones. La primera es un algoritmo de extremado bajo coste computacional que maximiza el parámetro WDO y esta basado en la estimación de una mascara binaria mediante un discriminante cuadrático que utiliza los valores ILD e ITD de cada punto tiempo-frecuencia para clasificarlo entre voz o ruido. El segundo algoritmo propuesto, también de bajo coste, utiliza además la información de puntos tiempo-frecuencia vecinos para estimar la IBM mediante una versión generalizada del LS-LDA. Además, se propone utilizar un MSE ponderado para estimar la IBM y maximizar el parámetro WDO al mismo tiempo. En ambos algoritmos se propone un esquema de transmisión eficiente energéticamente, que se basa en cuantificar los valores de amplitud y fase de cada banda de frecuencia con un numero distinto de bits. La distribución de bits entre frecuencias se optimiza mediante técnicas de computación evolutivas. El ultimo trabajo incluido en esta tesis trata del diseño de filtros espaciales para audífonos personalizados a una persona determinada. Los coeficientes del filtro pueden adaptarse a una persona siempre que se conozca su HRTF. Desafortunadamente, esta información no esta disponible cuando un paciente visita el audiólogo, lo que causa perdidas de ganancia y distorsiones. Con este problema en mente, se han propuesto tres métodos para diseñar filtros espaciales que maximicen la ganancia y minimicen las distorsiones medias para un conjunto de HRTFs de diseño
    corecore