2 research outputs found

    Limited-data automatic speaker verification algorithm using band-limited phase-only correlation function

    Get PDF
    In this paper, a new method to deal with automatic speaker verification based on band-limited phaseonly correlation (BLPOC) is proposed. The aim of this study is to validate the use of the BLPOC function as a new limited-data automatic speaker verification technique. Although some speaker verification techniques have high accuracy, efficiency usually depends on the extraction of complex theoretical information from speech signals and the amount of the data for training the algorithms. The BLPOC function is a high-accuracy biometric technique traditionally implemented in human identification by fingerprints (through image-matching)

    Correlaci贸n solo de fase limitada en banda y uso de coeficientes cepstrales inversos: aplicaci贸n en reconocimiento de voz y bioac煤stica

    Get PDF
    Digital signal processing is the application of mathematical operations to a piece of certain information. Because of its close relationship with other sciences, signal processing is the base of other science methodologies: automatic speech recognition and bioacoustics. Digital signal processing in this context is a solution tool. One of the most urgent problems is climate change. In this context, birds play a significant role where their identification and conservation are essential tasks. Even though automatic speech recognition provides specific solutions in bioacoustics, some of the traditional techniques fail in the capability of real field recognition. Since digital signal processing is a solution tool in a few contexts and bird species have acoustic patterns, it is possible to develop a new methodology in automatic speech recognition applied for recognition of species and individuals of birds (proposed efficiency over 70%). On the first phase of this research was to propose a new method for the speaker verification under limited data using the BLPOC function. After experiments, the BLPOC function confirmed to be an effective method. Taking these results into account, in the second phase a new technique for the individual identification of birds using the BLPOC function was proposed. The experiments confirmed that the BLPOC function is also an effective method for the individual identification of birds. Finally, in the same phase, another method for the automatic classification of species based on the IMFCC features was offered. Experiments conclude that the acoustic information of vocalizations in the high frequencies (captured by the IMFCC features) is as significant as the information in the low frequencies (captured by the traditional MFCC features).El procesamiento digital de se帽ales consiste en la aplicaci贸n de distintas operaciones matem谩ticas a una cierta informaci贸n bajo an谩lisis. Debido a su estrecha relaci贸n con otras ciencias, el procesamiento de se帽ales conforma la base de otras 谩reas de investigaci贸n como el reconocimiento autom谩tico de voz y la bioac煤stica. El procesamiento de se帽ales en este contexto conforma una herramienta de soluci贸n para diversas problem谩ticas. Una de las que m谩s relevancia tiene es el denominado: Cambio clim谩tico. En este contexto, las aves juegan un rol fundamental y por tanto la conservaci贸n e identificaci贸n de las especies de aves es de suma importancia. A pesar de que el reconocimiento de voz provee de soluciones para sistemas concretos en bioac煤stica, algunas de las t茅cnicas utilizadas fallan en la capacidad de reconocimiento en ambientes naturales.Tomando en cuenta lo anterior, dado que el procesamiento de se帽ales es una herramienta de soluci贸n en diversos contextos y tomando en cuenta que algunas especies de aves poseen patrones ac煤sticos, entonces es posible el desarrollo de una nueva metodolog铆a en reconocimiento de voz que luego puede ser extrapolada como parte del dise帽o de un nuevo sistema de reconocimiento autom谩tico para la identificaci贸n de aves (para algunas especies espec铆ficas) e individuos, con una eficiencia de reconocimiento por encima del 70%. En la primera fase de investigaci贸n fue propuesto una adaptaci贸n de la funci贸n BLPOC (correlaci贸n solo de fase limitada en banda) para la verificaci贸n autom谩tica de hablantes con datos limitados. Luego de las pruebas, la funci贸n BLPOC mostr贸 ser tambi茅n un m茅todo efectivo para un sistema de verificaci贸n de hablantes bajo la condici贸n de datos limitados. Tomando como base estos resultados, en la segunda fase se propuso una nueva t茅cnica para la identificaci贸n individual de aves mediante la funci贸n BLPOC. De las pruebas de desempe帽o se puede concluir que este es un m茅todo eficiente para la identificaci贸n de individuos de especies. En esta segunda fase se propuso un m茅todo adicional de clasificaci贸n autom谩tica de especies de aves basado en la extracci贸n de las caracter铆sticas IMFCC (coeficientes cepstrales inversos en la frecuencia mel ) de las vocalizaciones. De los resultados obtenidos se concluye que la informaci贸n ac煤stica de las vocalizaciones de aves en las altas frecuencias (capturadas por los IMFCC鈥檚) es tan significativa como la informaci贸n ac煤stica en las bajas frecuencias (capturadas por los MFCC麓s) para la clasificaci贸n de aves a trav茅s de vocalizaciones
    corecore