Reconhecimento de patologias da voz usando técnicas de processamento da fala

Abstract

O diagnóstico de patologias da voz envolve normalmente métodos invasivos que requerem esforços conjuntos de equipas multidisciplinares. A utilização de um método automático baseado em técnicas de processamento de fala, sendo não invasivo e rápido, pode ser um método de rastreio ou um diagnóstico preliminar ao realizado por especialistas. Esta tese propõe soluções para a identificação de patologias da voz através do processamento do sinal de fala. Os métodos utilizados envolvem classificadores tipicamente usados em reconhecimento de orador, como por exemplo support vector machines e Gaussian mixture models. Os parâmetros que modelam a fonte do aparelho fonador não têm obtido resultados relevantes na distinção entre patologias. Contudo abordagens com parâmetros que modelam o trato vocal obtêm melhor sucesso nesta tarefa, assim como nos diagnósticos de vozes patológicas. Nesta linha, os parâmetros utilizados nesses classificadores têm como objectivo modelar o trato vocal, como por exemplo os mel-frequency cepstral coefficients, os line spectral frequencies e mel-line spectral frequencies. É ainda proposto o uso de fala contínua como sinal para a identificação de patologias. Este sinal, ao exigir um maior esforço por parte do paciente e por ser mais rico em termos fonéticos, aliado ao facto de as patologias da voz produzirem alteração em todos os fonemas, permite melhorar os resultados no diagnóstico. Nesta abordagem foram realizados testes usando três classes: sujeitos saudáveis; sujeitos com patologias laríngeas fisiológicas (edemas e nódulos); e sujeitos com patologias laríngeas neuromusculares (paralisia unilateral das pregas vocais). A taxa de reconhecimento obtida foi de 84% para as três classes. Esta tese propõe também soluções para o reconhecimento de vozes patológicas, com base na análise de formantes e na relação harmónicas-ruído. Neste sentido, foi efectuada a implementação de um algoritmo simples baseado em árvores de decisão que permitiu uma taxa de reconhecimento de 95%

    Similar works