2 research outputs found

    A comparative between Mel Frequency Cepstral Coefficients (MFCC) and Inverse Mel Frequency Cepstral Coefficients (IMFCC) features for an Automatic Bird Species Recognition System

    No full text
    In this paper a comparative between Mel Frequency Cepstral Coefficients (MFCC) and Inverse Mel Frequency Cepstral Coefficients (IMFCC) features for an automatic bird species recognition system is proposed with the aim to validate IMFCC as a feature that can also be extracted for bird species recognition. In biodiversity monitoring task there are some traditional techniques and, bioacoustics studies biodiversity by a noninvasive way based on the relationship between animal species and its sounds. Bioacoustics methodology for avian conservation are based on automatic speech recognition techniques and one of the traditional extracted features in this area are MFCC. Nevertheless some new studies uses IMFCC as a complementary frequency information. From results, it is concluded that IMFCC features have better performance than traditional MFCC features but, performance still depends on the recognized bird sound

    Correlaci贸n solo de fase limitada en banda y uso de coeficientes cepstrales inversos: aplicaci贸n en reconocimiento de voz y bioac煤stica

    Get PDF
    Digital signal processing is the application of mathematical operations to a piece of certain information. Because of its close relationship with other sciences, signal processing is the base of other science methodologies: automatic speech recognition and bioacoustics. Digital signal processing in this context is a solution tool. One of the most urgent problems is climate change. In this context, birds play a significant role where their identification and conservation are essential tasks. Even though automatic speech recognition provides specific solutions in bioacoustics, some of the traditional techniques fail in the capability of real field recognition. Since digital signal processing is a solution tool in a few contexts and bird species have acoustic patterns, it is possible to develop a new methodology in automatic speech recognition applied for recognition of species and individuals of birds (proposed efficiency over 70%). On the first phase of this research was to propose a new method for the speaker verification under limited data using the BLPOC function. After experiments, the BLPOC function confirmed to be an effective method. Taking these results into account, in the second phase a new technique for the individual identification of birds using the BLPOC function was proposed. The experiments confirmed that the BLPOC function is also an effective method for the individual identification of birds. Finally, in the same phase, another method for the automatic classification of species based on the IMFCC features was offered. Experiments conclude that the acoustic information of vocalizations in the high frequencies (captured by the IMFCC features) is as significant as the information in the low frequencies (captured by the traditional MFCC features).El procesamiento digital de se帽ales consiste en la aplicaci贸n de distintas operaciones matem谩ticas a una cierta informaci贸n bajo an谩lisis. Debido a su estrecha relaci贸n con otras ciencias, el procesamiento de se帽ales conforma la base de otras 谩reas de investigaci贸n como el reconocimiento autom谩tico de voz y la bioac煤stica. El procesamiento de se帽ales en este contexto conforma una herramienta de soluci贸n para diversas problem谩ticas. Una de las que m谩s relevancia tiene es el denominado: Cambio clim谩tico. En este contexto, las aves juegan un rol fundamental y por tanto la conservaci贸n e identificaci贸n de las especies de aves es de suma importancia. A pesar de que el reconocimiento de voz provee de soluciones para sistemas concretos en bioac煤stica, algunas de las t茅cnicas utilizadas fallan en la capacidad de reconocimiento en ambientes naturales.Tomando en cuenta lo anterior, dado que el procesamiento de se帽ales es una herramienta de soluci贸n en diversos contextos y tomando en cuenta que algunas especies de aves poseen patrones ac煤sticos, entonces es posible el desarrollo de una nueva metodolog铆a en reconocimiento de voz que luego puede ser extrapolada como parte del dise帽o de un nuevo sistema de reconocimiento autom谩tico para la identificaci贸n de aves (para algunas especies espec铆ficas) e individuos, con una eficiencia de reconocimiento por encima del 70%. En la primera fase de investigaci贸n fue propuesto una adaptaci贸n de la funci贸n BLPOC (correlaci贸n solo de fase limitada en banda) para la verificaci贸n autom谩tica de hablantes con datos limitados. Luego de las pruebas, la funci贸n BLPOC mostr贸 ser tambi茅n un m茅todo efectivo para un sistema de verificaci贸n de hablantes bajo la condici贸n de datos limitados. Tomando como base estos resultados, en la segunda fase se propuso una nueva t茅cnica para la identificaci贸n individual de aves mediante la funci贸n BLPOC. De las pruebas de desempe帽o se puede concluir que este es un m茅todo eficiente para la identificaci贸n de individuos de especies. En esta segunda fase se propuso un m茅todo adicional de clasificaci贸n autom谩tica de especies de aves basado en la extracci贸n de las caracter铆sticas IMFCC (coeficientes cepstrales inversos en la frecuencia mel ) de las vocalizaciones. De los resultados obtenidos se concluye que la informaci贸n ac煤stica de las vocalizaciones de aves en las altas frecuencias (capturadas por los IMFCC鈥檚) es tan significativa como la informaci贸n ac煤stica en las bajas frecuencias (capturadas por los MFCC麓s) para la clasificaci贸n de aves a trav茅s de vocalizaciones
    corecore