1,125 research outputs found
Modelos ocultos de markov en espacios de disimilaridad: alternativas para la selección de prototipos
El criterio convencional de clasificación en sistemas que involucran modelos ocultos de Markov emplea la regla de máxima verosimilitud para escoger la clase correcta. Existe evidencia que muestra que la clasificación basada en disimilaridades entre modelos ocultos de Markov aumenta el desempeño del sistema. En este nuevo espacio de disimilaridades, las reglas de decisión pueden construirse usando todo el conjunto de entrenamiento o un conjunto reducido de prototipos adecuadamente seleccionados, que permiten minimizar el número de disimilaridades que deben medirse. En este artículo se comparan diferentes procedimientos para la selección de prototipos en el espacio de disimilaridades entre modelos ocultos de Markov
Diseño de prototipo para mejorar la dicción mediante el uso de Modelos Ocultos de Markov
La comunicación oral en el ser humano es muy importante, sin embargo, la buena comunicación, independientemente del idioma, debe ser clara, objetiva y expresiva con el fin de que lo que se quiere expresar sea lo que el oyente entienda. El reconocimiento de voz, por otro lado, se basa en el estudio sobre el proceso del habla y la comunicación, y la forma en que este conocimiento puede ser aplicado como herramienta para diversas finalidades. El enfoque de esta investigación es el desarrollo de un prototipo didáctico para realizar pruebas de dicción en el idioma español. Para ello, se utilizaron 3 técnicas basadas en Modelos Ocultos de Markov (HMM) las cuales son Modelos Ocultos de Markov con DTW (MDTW), Modelos Ocultos de Markov con DTW aproximado por izquierda y derecha (MID) y Modelos Ocultos de Markov con relleno de palabras (MRP). Con esta estructura se logró distinguir entre calidades de dicción y con una eficiencia de reconocimiento por encima del 90 % para cualquiera de las técnicas utilizadas. Finalmente, con base en lo anterior, se programó una interfaz en Matlab la cual brinda resultados para la corrección de la dicción
Introducción al procesamiento del habla mediante técnicas de deep learning
A lo largo de este trabajo se estudiarán de forma teórica la arquitectura de los reconocedores de voz basados en modelos generativos. En concreto se analizarán dos sistemas distintos: los sistemas basados en modelos ocultos de Markov y mezclas de gaussianas, y los modelos híbridos entre modelos ocultos de Markov y redes neuronales. Para ello se comenzará realizando una introducción al problema del recono- cimiento de voz. Después se analizarán de forma general modelos de mezclas de gaussianas, los modelos ocultos de Markov y las redes neuronales.
Finalmente se presentará la herramienta Kaldi, con la cuál se realizarán diversos experimentos para comparar y analizar las características de los distintos sistemas de reconocimiento de voz. En particular, nos centraremos en estudiar el comportamiento de las redes neuronales
Los modelos ocultos de Markov, MOM
Los Modelos Ocultos de Markov (MOM) son autómatas abstractos de estados finitos que permiten modelar procesos estocásticos, donde la ocurrencia de los estados está asociada con una distribución de probabilidad y donde las transiciones entre los estados están gobernadas por un conjunto de probabilidades llamadas probabilidades de transición de estados. En un estado particular, una observación se genera también de acuerdo a una distribución de probabilidad. Los estados no son visibles en general y su ocurrencia depende del estado en el instante anterior, de ahí el nombre de MOM (García, 2001; Peinado, 1994; Deller et al., 1993).
 
Diseño e implementación de un sistema de reconocimiento de patrones de voz basado en los modelos ocultos de Markov utilizando la plataforma de programación MATLAB.
Presenta una investigación teórica acerca de la señal de voz y la implementación de un algoritmo de reconocimiento de palabras aisladas utilizando modelos ocultos de Markov
Reconocimiento de actividades humanas mediante SVM semisupervisado y modelos ocultos de Markov
Automatic human activity recognition is an area of interest for developing health, security, and sports applications. Currently, it is necessary to develop methods that facilitate the training process and reduce the costs of this process. This paper explores a methodology to classify human physical activities in a semi-supervised paradigm. With this approach, it is possible to reduce the number of labels necessary to train the learning model and the complexity of this process. This process begins by deducting the number of micro-movements or sub-movements where the data should be grouped and assigning the label through a clustering technique. We perform this procedure for a specific group of micro-movements whose label is unknown. Later, the classification process starts by using two methods, a Support Vector Machine (SVM) that identifies the micro-movements and a Markov Hidden Model that detects the human physical activity as a function of sequences. The results show that with a percentage of 80 % of the known labels, we achieved outcomes like the supervised paradigms found in the literature. This facilitates training these learning models by reducing the number of examples requiring labels and reduces the economic costs, which is one of the significant limitations of machine learning processes.El reconocimiento automático de la actividad humana es un área de interés para el desarrollo de aplicaciones en salud, seguridad y deportes. Actualmente, es necesario desarrollar métodos que faciliten el proceso de entrenamiento y reduzcan los costos de este proceso. Este trabajo explora una metodología para clasificar actividades físicas humanas en un paradigma semi-supervisado. Con este enfoque, es posible reducir el número de etiquetas necesarias para entrenar el modelo de aprendizaje y la complejidad de este proceso. Este proceso comienza deduciendo el número de micro-movimientos o submovimientos en los que deben agruparse los datos y asignando la etiqueta mediante una técnica de clustering. Realizamos este procedimiento para un grupo específico de micro-movimientos cuya etiqueta se desconoce. Posteriormente, se inicia el proceso de clasificación utilizando dos métodos, una Máquina de Vectores Soportados (SVM) que identifica los micro-movimientos y un Modelo Oculto de Markov que detecta la actividad física humana en función de secuencias. Los resultados muestran que con un porcentaje del 80 % de las etiquetas conocidas, se consigue resultados como los paradigmas supervisados encontrados en la literatura. Esto facilita el entrenamiento de estos modelos de aprendizaje al reducir el número de ejemplos que requieren etiquetas y reduce los costes económicos, que es una de las limitaciones significativas de los procesos de aprendizaje automático
Aplicación de modelos ocultos de Markov en pruebas de dicción de palabras aisladas del idioma español
By oral communication , human beings have achieved, among other things, the transmission
of ideas and knowledge. However, good communication regardless of the language, should be
clear, objective and expressive so that what is meant is what the listener understands.
A few decades ago it was thought that training the voice was matter of commentators, announcers,
reporters, and others. Today, however, we can’t leave this matter to those areas; instead,
anyone needs to talk a correct, clear and natural language.
Speech recognition is based on the research of the process of speech and communication, and
how this knowledge can be applied as a tool for different purposes.
The focus of this research is the use of Hidden Markov Models in order to perform tests of
diction in the Spanish language on isolated words. To do so, we propose three different methods
which are modifications in the application of Hidden Markov Models which are Hidden
Markov Models with DTW (MDTW), Hidden Markov Models with DTW approximated
by left and right (MID) and Hidden Markov Models filling words (MRP).
Through this research for speech recognition, becomes possible to distinguish between qualities
of diction and a recognition efficiency above 90 % for any of the proposed methods.Gracias a la comunicación oral el ser humano ha logrado, entre otras cosas, la transmisión de
ideas y conocimientos. Sin embargo, la buena comunicación, independientemente del idioma,
debe ser clara, objetiva y expresiva con el fin de que lo que se quiere expresar sea lo que el
oyente entienda.
Hace algunas décadas se pensaba que educar la voz era asunto de los comentaristas, locutores,
reporteros, entre otros. Hoy en día, sin embargo, no se puede dejar este asunto para aquellas
áreas antes mencionadas sino que cualquier persona necesita hablar un lenguaje correcto, claro
y natural.
El reconocimiento de voz se basa en el estudio sobre el proceso del habla y la comunicación,
y la forma en que este conocimiento puede ser aplicado como herramienta para diversas finalidades.
El enfoque de esta investigación es la aplicación de Modelos Ocultos de Markov con la finalidad
de realizar pruebas de dicción en el idioma español de palabras aisladas. Para ello se
propone el uso de tres diferentes métodos que son modificaciones en la aplicación de Modelos
Ocultos de Markov los cuales son Modelos Ocultos de Markov con DTW (MDTW), Modelos
Ocultos de Markov con DTW aproximado por izquierda y derecha (MID) y Modelos
Ocultos de Markov con relleno de palabras (MRP).
Mediante esta investigación para reconocimiento del habla se hace posible el distinguir entre
calidades de dicción y con una eficiencia de reconocimiento por encima del 90 % para
cualquiera de los métodos propuestos
Conversión de voz basada en Modelos Ocultos de Markov
El objetivo del proyecto es implementar una herramienta de conversión voz a voz, donde partiendo de una señal de voz de un locutor fuente se transforme para que suene como la voz de un locutor objetivo. Con esta herramienta un único locutor podría generar diferentes voces objetivo, pero con su propia entonación, pausas y dinámica
- …