2 research outputs found

    The effect of reverberation in intelligibility and speaker

    Get PDF
    Orientadores: Bruno Sanches Masiero, Rosângela Fernandes CoelhoDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: Nessa Dissertação, é estudado o impacto do efeito da reverberação em sistemas de identificação de locutor com casamento e descasamento de reverberações entre treinamento e teste. No desenvolvimento do trabalho, uma análise do efeito é realizada a partir das medidas espectrograma, cocleograma, INS (índice de não-estacionariedade) e distância Bhattacharyya do sinal de voz reverberado em diferentes condições. O estudo mostrou que o aumento do valor de RT60 em uma sala causa uma diminuição da não-estacionariedade do sinal de voz reverberado. Em seguida, experimentos com medidas objetivas indicam como a reverberação é capaz de degradar a inteligibilidade do sinal de voz e que a utilização de máscaras acústicas pode atenuar estes efeitos. Por fim, é proposto o emprego de máscaras acústicas para identificação de locutor em ambientes com reverberação. Experimentos de identificação de locutor indicaram que o uso de máscaras acústicas melhora os resultados de identificação para casamento de reverberação entre treinamento e teste. Também foi proposta a utilização do atributo acústico GFCC (Gammatone Frequency Cepstral Coefficients) e do classificador alfa-GMM para a identificação de locutor com reverberação. Estas técnicas se mostraram eficazes em recuperar as taxas de acerto em casos de descasamento de reverberação em uma mesma salaAbstract: This work presents a study about the effect of reverberation in speaker identification systems with mismatch between training and testing phases. Spectrograms, cochleograms INS (Index of Non-Stationarity) and the Bhattacharyya distance are used to analyze the reverberated speech signal under several conditions. This study show that an improvent in RT60 in a room can reduce the non-stationarity of the reverberated speech. Also, objective measures indicate that reverberation degrades speech intelligibility, that can be improved by binary masks, that are are proposed to improve speaker identification systems under reverberant conditions. Results show that the technique improved the identification rates for reverberation matches between training and testing. The classifier alfa-GMM and the acoustic feature GFCC (Gammatone Frequency Cepstral Coefficients) are also proposed in this work for speaker identification in reverberant conditions. Those techniques were capable of improve the correct rates under reverberation mismatch in a roomMestradoTelecomunicações e TelemáticaMestre em Engenharia Elétric

    Single-Microphone Speech Enhancement and Separation Using Deep Learning

    Get PDF
    corecore