Cálculo y análisis del pitch en señales sonoras de voz humana

Abstract

El análisis del pitch involucra diferentes tópicos dentro del estudio de señales sonoras aún no explorados completamente. En virtud de la imprecisión en su propia definición se pueden implementar una gran variedad de algoritmos para su adquisición. Históricamente se ha definido al pitch como la frecuencia fundamental de espectro de frecuencias del habla [Casacuberta87] y se lo ha asociado al movimiento que realiza la glotis en la generación del sonido [Husson62]. Desafortunadamente cualquiera sea la forma en la que se lo defina no se ajustará a la realidad, porque la oscilación glotal es una función cuasi-periódica [Klatt87]. Además, esta frecuencia no es fácilmente identificable debido a que en algunas situaciones prácticamente desaparece de la onda sonora. Esto ocurre cuando las articulaciones del tracto vocal hacen que la energía del sonido se concentre en algunos de sus armónicos. No obstante no se lo pierde completamente y se puede utilizar dichos armónicos para su rastreo. Se ha observado que esta vibración no es constante a lo largo del discurso, detectándose variaciones a lo largo de la frase y también dentro mismo de una palabra. Estas variaciones se deben tanto a la entonación de la frase, como a la acentuación de los fonemas así como al estado emocional del orador [Rocha87] [Klatt87].Eje: Procesamiento de SeñalesRed de Universidades con Carreras en Informática (RedUNCI

    Similar works