5 research outputs found

    Reconocimiento de patrones de habla usando MFCC y RNA

    Get PDF
    In this work the results of the design and development of an algorithm based on artificial intelligence and MFCC for recognizing speech patterns are presented. The using of MFCC allowed to characterize voice signals, having into account the noise in the record environment, which helps with the estimation of common patterns among these signals when presents disturbances. As a main result of this work, a recognizing rate between 93 and 96% for the selected vowels (/a/,/e/,/o/) was achieved. For the training a number of 22 samples were used and others 11 for the validation process. The samples were obtained from 11 test subjects, all of them of male genre.En este trabajo se presentan los resultados del diseño y desarrollo de un algoritmo basado en inteligencia artificial para el reconocimiento de patrones de vocablos del idioma español, utilizando Coeficientes Cepstrales en las Frecuencias de Mel o (MFCC), para representar el habla a través de la percepción auditiva del ser humano. La utilización de MFCC permitió caracterizar las señales de voz teniendo en cuenta el posible ruido presente en el ambiente de grabación, lo cual ayudo a la obtención de patrones comunes entre estas señales cuando presentan alteraciones. Como resultado se obtuvo un reconocimiento superior al 95% de las tres vocales escogidas, en este caso la /a/,/e/,/o/, entre un grupo de 22 muestras por vocal para el entrenamiento y 11 muestras para la validación. Las muestras fueron obtenidas de 11 personas, todas del género masculino

    No-estacionariedad, multifractalidad y limpieza de ruido en señales reales

    Get PDF
    Las señales biomédicas, como el electrocardiograma, el electroencefalograma, o la señal de voz, tienen en común características de no estacionariedad y no linealidad. Aunque enmuchas aplicaciones se considera que se trata de señales estacionarias procedentes de sistemas lineales, ésta simplificación constituye una hipótesis de trabajo válida sólo como una aproximación que permite la aplicación de técnicas clásicas deanálisis de señales. Muchos trastornos que afectan a uno o varios órganos pueden ser detectados a través de un correcto análisis de las señales en cuya producción están involucrados. Sin embargo, debe atenderse al hecho de que una señal procedente de un sistema patológico se aleja aún más de las condiciones hipotéticas de estacionariedad y linealidad. Se desprende de esta circunstancia la necesidad de abordar el análisis de las señales biomédicas mediante técnicas no convencionales que permitan su tratamiento en un marco que tenga en cuenta sus características de no estacionariedad y no linealidad. Sobre la base de la experiencia del grupo de trabajo en las áreas del análisis tiempo-frecuencia/escala, análisis y modelado estadístico, análisis multifractal, complejidad y métodos guiados por los datos (adaptativos), a partir de problemas reales se han propuesto y estudiado nuevas técnicas que posibiliten su solución

    Monitoramento da rugosidade no processo de torneamento duro utilizando coeficientes Mel-Cepstrais de Sinais Acústicos e Modelos de Misturas de Gaussianas.

    Get PDF
    O objetivo deste trabalho é avaliar a emissão de sinais acústicos durante o processo de torneamento do aço ABNT 52100 endurecido e identificar os parâmetros do sinal que sejam capazes de representar a rugosidade resultante da peça. Partindo desses parâmetros, propõe-se um novo método de monitoramento do processo utilizando modelos de misturas de Gaussianas (GMM). A principal característica desta nova abordagem é a utilização do som como meio de monitoramento. Além de apresentar vantagens como a facilidade de aquisição de dados e o baixo custo dos sensores (microfones), ainda é um sinal pouco explorado em técnicas de monitoramento. Para correlacionar a rugosidade resultante do processo de torneamento com os parâmetros do som emitido, técnicas de processamento de sinais digitais foram utilizadas para a extração de parâmetros como perfil de energia e coeficientes mel-cepstrais (MFCC). Estes parâmetros foram utilizados para treinar modelos de misturas de Gaussianas para representar cada grupo de rugosidade identificado. No treinamento dos modelos GMM, foram utilizadas 4 e 8 gaussianas a fim de avaliar o impacto no desempenho do método proposto. Ao apresentar o conjunto de sinais de teste aos modelos treinados, obteve-se uma superioridade nos modelos treinados com MFCC, apresentando uma taxa de acerto média de 94,27%. Já o número de Gaussianas não proporcionou aumento significativo de desempenho. A partir destes resultados, concluiu-se que o sinal acústico (som), através de parâmetros como os coeficientes mel-cepstrais, pode ser utilizado como forma de identificar variações no comportamento do processo, principalmente a rugosidade resultante da peça, o que permite o monitoramento da qualidade do processo de forma não destrutiva

    Evolutionary cepstral coefficients

    No full text
    Evolutionary algorithms provide flexibility and robustness required to find satisfactory solutions in complex search spaces. This is why they are successfully applied for solving real engineering problems. In this work we propose an algorithm to evolve a robust speech representation, using a dynamic data selection method for reducing the computational cost of the fitness computation while improving the generalisation capabilities. The most commonly used speech representation are the mel-frequency cepstral coefficients, which incorporate biologically inspired characteristics into artificial recognizers. Recent advances have been made with the introduction of alternatives to the classic mel scaled filterbank, improving the phoneme recognition performance in adverse conditions. In order to find an optimal filterbank, filter parameters such as the central and side frequencies are optimised. A hidden Markov model is used as the classifier for the evaluation of the fitness for each individual. Experiments were conducted using real and synthetic phoneme databases, considering different additive noise levels. Classification results show that the method accomplishes the task of finding an optimised filterbank for phoneme recognition, which provides robustness in adverse conditions.Fil: Vignolo, Leandro Daniel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional; ArgentinaFil: Rufiner, Hugo Leonardo. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional; ArgentinaFil: Milone, Diego Humberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional; ArgentinaFil: Goddard, John C.. Universidad Autónoma Metropolitana; Méxic
    corecore