1,125 research outputs found

    Modelos ocultos de markov en espacios de disimilaridad: alternativas para la selección de prototipos

    Get PDF
    El criterio convencional de clasificación en sistemas que involucran modelos ocultos de Markov emplea la regla de máxima verosimilitud para escoger la clase correcta. Existe evidencia que muestra que la clasificación basada en disimilaridades entre modelos ocultos de Markov aumenta el desempeño del sistema. En este nuevo espacio de disimilaridades, las reglas de decisión pueden construirse usando todo el conjunto de entrenamiento o un conjunto reducido de prototipos adecuadamente seleccionados, que permiten minimizar el número de disimilaridades que deben medirse. En este artículo se comparan diferentes procedimientos para la selección de prototipos en el espacio de disimilaridades entre modelos ocultos de Markov

    Diseño de prototipo para mejorar la dicción mediante el uso de Modelos Ocultos de Markov

    Get PDF
    La comunicación oral en el ser humano es muy importante, sin embargo, la buena comunicación, independientemente del idioma, debe ser clara, objetiva y expresiva con el fin de que lo que se quiere expresar sea lo que el oyente entienda. El reconocimiento de voz, por otro lado, se basa en el estudio sobre el proceso del habla y la comunicación, y la forma en que este conocimiento puede ser aplicado como herramienta para diversas finalidades. El enfoque de esta investigación es el desarrollo de un prototipo didáctico para realizar pruebas de dicción en el idioma español. Para ello, se utilizaron 3 técnicas basadas en Modelos Ocultos de Markov (HMM) las cuales son Modelos Ocultos de Markov con DTW (MDTW), Modelos Ocultos de Markov con DTW aproximado por izquierda y derecha (MID) y Modelos Ocultos de Markov con relleno de palabras (MRP). Con esta estructura se logró distinguir entre calidades de dicción y con una eficiencia de reconocimiento por encima del 90 % para cualquiera de las técnicas utilizadas. Finalmente, con base en lo anterior, se programó una interfaz en Matlab la cual brinda resultados para la corrección de la dicción

    Introducción al procesamiento del habla mediante técnicas de deep learning

    Get PDF
    A lo largo de este trabajo se estudiarán de forma teórica la arquitectura de los reconocedores de voz basados en modelos generativos. En concreto se analizarán dos sistemas distintos: los sistemas basados en modelos ocultos de Markov y mezclas de gaussianas, y los modelos híbridos entre modelos ocultos de Markov y redes neuronales. Para ello se comenzará realizando una introducción al problema del recono- cimiento de voz. Después se analizarán de forma general modelos de mezclas de gaussianas, los modelos ocultos de Markov y las redes neuronales. Finalmente se presentará la herramienta Kaldi, con la cuál se realizarán diversos experimentos para comparar y analizar las características de los distintos sistemas de reconocimiento de voz. En particular, nos centraremos en estudiar el comportamiento de las redes neuronales

    Los modelos ocultos de Markov, MOM

    Get PDF
    Los Modelos Ocultos de Markov (MOM) son autómatas abstractos de estados finitos que permiten modelar procesos estocásticos, donde la ocurrencia de los estados está asociada con una distribución de probabilidad y donde las transiciones entre los estados están gobernadas por un conjunto de probabilidades llamadas probabilidades de transición de estados. En un estado particular, una observación se genera también de acuerdo a una distribución de probabilidad. Los estados no son visibles en general y su ocurrencia depende del estado en el instante anterior, de ahí el nombre de MOM (García, 2001; Peinado, 1994; Deller et al., 1993). &nbsp

    Diseño e implementación de un sistema de reconocimiento de patrones de voz basado en los modelos ocultos de Markov utilizando la plataforma de programación MATLAB.

    Get PDF
    Presenta una investigación teórica acerca de la señal de voz y la implementación de un algoritmo de reconocimiento de palabras aisladas utilizando modelos ocultos de Markov

    Probabilidades Intervalares em Modelos Ocultos de Markov

    Full text link

    Síntesis de voz mediante Modelos Ocultos de Markov

    Get PDF

    Reconocimiento de actividades humanas mediante SVM semisupervisado y modelos ocultos de Markov

    Get PDF
    Automatic human activity recognition is an area of interest for developing health, security, and sports applications. Currently, it is necessary to develop methods that facilitate the training process and reduce the costs of this process. This paper explores a methodology to classify human physical activities in a semi-supervised paradigm. With this approach, it is possible to reduce the number of labels necessary to train the learning model and the complexity of this process. This process begins by deducting the number of micro-movements or sub-movements where the data should be grouped and assigning the label through a clustering technique. We perform this procedure for a specific group of micro-movements whose label is unknown. Later, the classification process starts by using two methods, a Support Vector Machine (SVM) that identifies the micro-movements and a Markov Hidden Model that detects the human physical activity as a function of sequences. The results show that with a percentage of 80 % of the known labels, we achieved outcomes like the supervised paradigms found in the literature. This facilitates training these learning models by reducing the number of examples requiring labels and reduces the economic costs, which is one of the significant limitations of machine learning processes.El reconocimiento automático de la actividad humana es un área de interés para el desarrollo de aplicaciones en salud, seguridad y deportes. Actualmente, es necesario desarrollar métodos que faciliten el proceso de entrenamiento y reduzcan los costos de este proceso. Este trabajo explora una metodología para clasificar actividades físicas humanas en un paradigma semi-supervisado. Con este enfoque, es posible reducir el número de etiquetas necesarias para entrenar el modelo de aprendizaje y la complejidad de este proceso. Este proceso comienza deduciendo el número de micro-movimientos o submovimientos en los que deben agruparse los datos y asignando la etiqueta mediante una técnica de clustering. Realizamos este procedimiento para un grupo específico de micro-movimientos cuya etiqueta se desconoce. Posteriormente, se inicia el proceso de clasificación utilizando dos métodos, una Máquina de Vectores Soportados (SVM) que identifica los micro-movimientos y un Modelo Oculto de Markov que detecta la actividad física humana en función de secuencias. Los resultados muestran que con un porcentaje del 80 % de las etiquetas conocidas, se consigue resultados como los paradigmas supervisados encontrados en la literatura. Esto facilita el entrenamiento de estos modelos de aprendizaje al reducir el número de ejemplos que requieren etiquetas y reduce los costes económicos, que es una de las limitaciones significativas de los procesos de aprendizaje automático

    Aplicación de modelos ocultos de Markov en pruebas de dicción de palabras aisladas del idioma español

    Get PDF
    By oral communication , human beings have achieved, among other things, the transmission of ideas and knowledge. However, good communication regardless of the language, should be clear, objective and expressive so that what is meant is what the listener understands. A few decades ago it was thought that training the voice was matter of commentators, announcers, reporters, and others. Today, however, we can’t leave this matter to those areas; instead, anyone needs to talk a correct, clear and natural language. Speech recognition is based on the research of the process of speech and communication, and how this knowledge can be applied as a tool for different purposes. The focus of this research is the use of Hidden Markov Models in order to perform tests of diction in the Spanish language on isolated words. To do so, we propose three different methods which are modifications in the application of Hidden Markov Models which are Hidden Markov Models with DTW (MDTW), Hidden Markov Models with DTW approximated by left and right (MID) and Hidden Markov Models filling words (MRP). Through this research for speech recognition, becomes possible to distinguish between qualities of diction and a recognition efficiency above 90 % for any of the proposed methods.Gracias a la comunicación oral el ser humano ha logrado, entre otras cosas, la transmisión de ideas y conocimientos. Sin embargo, la buena comunicación, independientemente del idioma, debe ser clara, objetiva y expresiva con el fin de que lo que se quiere expresar sea lo que el oyente entienda. Hace algunas décadas se pensaba que educar la voz era asunto de los comentaristas, locutores, reporteros, entre otros. Hoy en día, sin embargo, no se puede dejar este asunto para aquellas áreas antes mencionadas sino que cualquier persona necesita hablar un lenguaje correcto, claro y natural. El reconocimiento de voz se basa en el estudio sobre el proceso del habla y la comunicación, y la forma en que este conocimiento puede ser aplicado como herramienta para diversas finalidades. El enfoque de esta investigación es la aplicación de Modelos Ocultos de Markov con la finalidad de realizar pruebas de dicción en el idioma español de palabras aisladas. Para ello se propone el uso de tres diferentes métodos que son modificaciones en la aplicación de Modelos Ocultos de Markov los cuales son Modelos Ocultos de Markov con DTW (MDTW), Modelos Ocultos de Markov con DTW aproximado por izquierda y derecha (MID) y Modelos Ocultos de Markov con relleno de palabras (MRP). Mediante esta investigación para reconocimiento del habla se hace posible el distinguir entre calidades de dicción y con una eficiencia de reconocimiento por encima del 90 % para cualquiera de los métodos propuestos

    Conversión de voz basada en Modelos Ocultos de Markov

    Get PDF
    El objetivo del proyecto es implementar una herramienta de conversión voz a voz, donde partiendo de una señal de voz de un locutor fuente se transforme para que suene como la voz de un locutor objetivo. Con esta herramienta un único locutor podría generar diferentes voces objetivo, pero con su propia entonación, pausas y dinámica
    corecore