1,675 research outputs found

    Algoritmo para el cálculo del ritmo en una señal de audio digital

    Get PDF
    En este trabajo se presenta un algoritmo para la extracción del ritmo de una señal audio digital. El ritmo está formado por los cambios de intensidad en la señal de audio. El ritmo marca cambios significativos en las señales acústicas. A través de un procedimiento de filtrado para la extracción de la envolvente de la señal de audio, luego a través de una señal cuadrada se marcan los puntos de inicio y su duración de los cambios de ritmo en la señal de audio. El algoritmo se prueba con una señal de un metrónomo de 60pps para validar esta propuesta

    Clasificación de género basada en señales de voz mediante modelos difusos y algoritmos de optimización

    Get PDF
    This paper describes a gender classification scheme based on voice signals in which 16 different fuzzy models are proposed and optimized using four bio-inspired optimization algorithms and the quasi-Newton method. The classification scheme considers four data sets and five different voice features to define the input values of an algorithm in the optimization process. The inputs of each fuzzy model define the mean and variance of their Gaussian membership functions, and their fitness is evaluated by the input values of the algorithm and mean squared error as objective function to be minimized. A comparative analysis between models, algorithms and data sets is made to obtain conclusions according to the results of each optimized model.En este documento se describe un esquema de clasificación de género, basado en señales de voz, en el que se proponen y prueban 16 modelos difusos diferentes que son optimizados mediante cuatro algoritmos bioinspirados y el método cuasi-Newton. El esquema de clasificación considera cuatro conjuntos de datos y cinco características de voz diferentes para definir los valores de entrada de un algoritmo en el proceso de optimización. Los valores de entrada de cada modelo difuso definen la media y varianza de sus funciones de pertenencia gaussianas, y su desempeño se evalúa mediante los valores de entrada del algoritmo de optimización y el error cuadrático medio como función objetivo para minimizar. Se hace un análisis comparativo entre modelos, algoritmos y conjuntos de datos para obtener conclusiones de acuerdo con los resultados de cada modelo optimizado

    Diseño y construcción de sistema de detección de tempo de batería y sincronización con Daw

    Get PDF
    En este trabajo de investigación se desarrolló un sistema para la detección de tempo de patrones rítmicos interpretados en una batería y la sincronización de pistas musicales dispuestas en un DAW en tiempo real. La investigación se dividió en tres segmentos principales. En la primera fase, se evaluaron diferentes transductores de entrada para adquirir la señal de la batería y determinar el mejor método de captura. En la segunda fase, se desarrolló el software de detección, basado en el método de autocorrelación (ACF) para la estimación de las periodicidades, utilizando las señales obtenidas de la batería. Por último, se evaluó la efectividad del dispositivo y la facilidad de uso del mismo mediante pruebas objetivas y subjetivas.Universidad de San Buenaventura Bogot

    Implementación de un Espectrómetro con el módulo TMS320VC5505 eZdsp de Texas Instruments

    Get PDF
    El proyecto que va a describirse en el siguiente documento corresponde al ámbito de Procesado Digital de Señales en tanto que se ha implementado una aplicación capaz de adquirir una señal de audio, determinar sus componentes frecuenciales y mostrarlas, según su amplitud, en un dispositivo de visualización externo, que se ha diseñado e implementado para este propósito, en tiempo real. De esta forma, el proyecto queda dividido en dos áreas diferenciadas, que son la programación de la aplicación del DSP TMS320VC5505 y el diseño e implementación del dispositivo hardware externo de visualización.Peer Reviewe

    Clasificador de subgéneros de música electrónica

    Get PDF
    ¿Qué hace que nosotros, los humanos, seamos capaces de diferenciar canciones de distintos géneros? Quizás el lector se habrá encontrado alguna vez en la difícil situación de explicar a alguien “cómo suena” el estilo de música que le gusta. Entonces, ¿podría existir una clasificación de géneros automática?. El incremento del contenido digital disponible en diversas áreas nos obliga a buscar formas más rápidas y eficientes de almacenar y ordenar la información. Nunca había sido tan fácil hacer música y miles de canciones nuevas se publican cada día. En sitios web como Beatport, cada semana se publican 25.000 canciones nuevas de música electrónica. Probablemente sería de gran ayuda clasificar automáticamente todo este contenido. En la actualidad, con los algoritmos de aprendizaje automático se buscan patrones comunes para clasificar y facilitar el acceso de datos digitalizados. Durante los últimos 20 años, se ha estudiado el reconocimiento de géneros musicales para predecir automáticamente el género de una canción. En los estudios pasados se han clasificado géneros y subgéneros en distintos estilos musicales, pero hasta donde alcanza nuestro conocimiento, nunca se ha abordado la clasificación de subgéneros de música electrónica. No obstante, existe una amplia variedad de música electrónica y a pesar de que para un oyente ocasional todo podría sonar tremendamente parecido, los fans distinguen entre subgéneros. Por lo tanto tienen que tener características que los definan. La clasificación en géneros es subjetiva, pero partiendo de un conjunto debidamente clasificado podemos pensar que los diferentes géneros tienen algunas cualidades intrínsecas objetivables que los caracterizan. En este proyecto, nuestro objetivo es clasificar automáticamente subgéneros de música electrónica atendiendo exclusivamente a datos de audio

    SAMAD: sincronización automática de mensajes de audiodescripción

    Get PDF
    Mediante el uso de algoritmos de comparación de audio, la problemática que existe para la reproducción automática de audiodescripciones en una proyección cinematográfica de celuloide de 35mm puede ser solucionada. El objetivo del proyecto SAMAD será estudiar la precisión que tienen éstos al realizar dicho cometido.Siguiendo esta línea, el proyecto SAMAD promocionará el servicio de audiodescripción en las salas cinematográficas cuyo sistema de proyección sea de celuloide. Se pretende que cualquier persona con deficiencia visual disfrute de una proyección cinematográfica con unos mínimos de calidad en el acceso a la información que en ella se transmite.Ingeniería en Informátic

    Implementación de un prototipo para la medición del pulso cardíaco mediante procesamiento de vídeo en la tarjeta de desarrollo JETSON TX1

    Get PDF
    Proyecto de Graduación (Licenciatura en Ingeniería Electrónica) Instituto Tecnológico de Costa Rica, Escuela de Ingeniería Electrónica, 2018Non-invasive techniques for vital signs monitoring have been developing in the last years due to interdisciplinary fields like the computer vision and artificial intelligence. So, in RidgeRun Engineering, there is a need for implementing an image processing system based on the Eulerian video Magnification (EVM) algorithm to detect the heart pulse in the embedded system Jetson TX1, as a way to explore its capabilities. This document describes the design and implementation of this system to detect the heart pulse of a person from video images. The application can be split into two main stages: the implementation of the EVM algorithm in C++ and the post-processing necessary in the video with the magnified signal of interest. In the first stage, the architecture of the algorithm implementation is detailed and for the second stage, the approach to extract the heart pulse is described. A wide variety of tests have been done to verify the implementation, this includes: the calculation of the structural similarity (SSIM), the quantitative comparison of the heart pulse with simultaneous measurements from an oximeter and performance tests. The results demonstrate that the solution, using the GPU, is capable to estimate the heart pulse with an accuracy near the 95 %

    Recuperación de la información musical por similitud usando redes neuronales

    Get PDF
    En los últimos años, la distribución de música digital en la web ha permitido a los usuarios acceder a grandes cantidades de información musical, con ello surge la necesidad de obtener esa información de manera eficaz y eficiente. En la actualidad, los sistemas de recuperación han ayudado a los usuarios a encontrar información basada en texto, pero esos modelos tradicionales no son adecuados si deseamos encontrar canciones que se parezcan en contenido de audio, de allí la necesidad de modelar e implementar métodos de recuperación basado en audio musical. En este estudio se describe un sistema que permite recuperar y clasificar canciones por similitud basado en contenido de audio musical. Se aplica un modelo de red neuronal a características de canciones. Primero se obtiene descriptores de canciones polifónicas en formato mp3 con características tales como: Análisis Espectral, Patrones de ritmo, Histograma de ritmo. Segundo, se realiza un análisis estadístico para seleccionar los descriptores válidos. Finalmente se ingresa a una red neuronal estos descriptores y se entrena. El objetivo de este trabajo es implementar el sistema y determinar, a partir de los resultados experimentales, la eficiencia de acierto o no para clasificar y recuperar contenido de audio musical por similitud.Tesi

    Extractor de Información Rítmica de Señales Musicales

    Get PDF
    Se propone un sistema para el análisis y seguimiento del ritmo directamente de una señal acústica musical. La inducción del ritmo es la base para lsincronización de diversas aplicaciones multimedia como la edición de vídeo, audio y el control de iluminación. El sistema segmenta el material acústico en eventos musicales mediante la detección de las transiciones bruscas de energía (discriminación de los componentes de mayor rapidez de incremento de potencia) respecto a una vecindad potencial en el plano tiempo-frecuencia y genera una lista de eventos con la información de los tiempos de ataque y la contribución energética relativa por componente. La inducción del tempo estima, con cierta certidumbre, la próxima posición temporal correspondiente a un acento rítmico importante. El modelo de percepción del ritmo se basa en la descomposición del contexto o patrón temporal en curvas de experanza básica por cada intervalo implícito y su proyección hacia el futuro. Se propone una formalización matemática del modelo desde el paradigma teórico psicoperceptual. La esperanza resultante del patrón temporal complejo generado por la segmentación sirve para modelar tópicos tan diversos como la percepción categórica del ritmo, la inducción del reloj y el metro, la ritmicidad y la similitud de secuencias temporales. La inducción del tempo directamente del material acústico permite modelar la expresividad temporal e inflexiones del tempo en favor del proceso de cuantización

    Implementation of an algorithm for users identification considering physiological problems affecting the speech

    Get PDF
    This paper shows the design and implementation of an algorithm for users voice identification, including considerations on physiologic issues affecting the speech so that when users manifest these problems, lower rates on fake rejections decrease. For purposes of managing the contemplated physiologic problems, algorithm design also takes a standard algorithm that uses cepstral coefficients which include additional characteristics determined by voice acoustic analysis. A test including several records from people with a healthy voice and those with voice affections is carried out in order to observe the performance of the algorithm; thus, observing that when applying those characteristics in voice analysis a better result is achieved regarding the case when cepstral coefficients are implemented.En este documento se presenta el diseño e implementación de un algoritmo para la identificación de usuarios por medio de voz, considerando problemas fisiológicos que afectan el habla de tal forma, que al presentarse este tipo de problemas en los usuarios se logre una baja tasa de falsos rechazos. Para el diseño del sistema se toma como base un algoritmo estándar que utiliza coeficientes cepstrales, al cual se le incorporan otras características que son definidas mediante un análisis acústico de la voz; de esta forma se puede manejar los problemas fisiológicos considerados. Con el fin de observar el desempeño del algoritmo, se lleva a cabo una prueba con varios archivos, tanto de personas sanas como también con afectaciones de la voz, observando que al incorporar las características establecidas del análisis de la voz, se logra un mejor resultado en relación con el caso donde solo se emplean coeficientes cepstrales
    corecore