Sociedad Española para el Procesamiento del Lenguaje Natural
Abstract
El objetivo del estudio que aquí se presenta es el de analizar el efecto de la variación de la
frecuencia fundamental en las características de la señal de voz, estudiar los efectos de este
parámetro sobre el comportamiento de los sistemas de reconocimiento de habla continua y evaluar
técnicas de compensación de los efectos observados. Para llevarlo a cabo se han grabado varias
bases de datos específicas que también se describen. Las pruebas realizadas indican que la tasa de
acierto del sistema se ve afectada por el valor medio de la frecuencia fundamental, llegando a
experimentar una reducción relativa del 38.8% para algunos valores extremos de este parámetro.
La aplicación de la técnica MLLR permite compensar en parte esta degradación, experimentándose
reducciones de la tasa de error de hasta el 51.9% para los locutores más problemáticos con sólo 10
frases de adaptación