Search CORE

3,382 research outputs found

Reconocimiento de comandos de voz en español orientado al control de una silla de ruedas

Author: Gil Vásquez Lily Jhohana
Publication venue: 'Facultad De Ingenieria Universidad Del Zulia'
Publication date: 01/01/2015
Field of study

El propósito de un sistema de reconocimiento del habla es tomar como entrada la forma de onda acústica de la voz humana y producir como salida una cadena de palabras equivalente [1]. Para lograr dicho resultado, la señal de voz ingresa a un módulo de procesamiento de señales en el que se extraen los vectores de características sobresalientes que son enviados posteriormente al decodificador; el decodificador utiliza tanto un modelo acústico como un modelo de lenguaje para generar finalmente la secuencia de palabras que tienen la máxima probabilidad de asemejarse a los vectores de características de entrada [2]. El modelo acústico es esencial para definir el comportamiento del sistema, este se obtiene con corpus de habla (ficheros de voz que contienen los datos de una amplia población de oradores con su correspondiente transcripción) de voces recogidas en el mismo idioma en el que se realizará el reconocimiento, mientras más robusto sea el corpus mejor será su desempeño. Si bien existen varias herramientas de software para realizar desarrollos con reconocimiento del habla, el hecho de que este proyecto es desarrollado para comandos en español limita su escogencia y finalmente se opta por hacer el desarrollo con el SAPI de Microsoft que para este idioma ya tiene un desarrollo importante. Otras herramientas como “Julius” solo ponen a disposición modelos acústicos completos en japonés o en otros pocos idiomas principalmente el inglés.The purpose of a speech recognition system is to take the acoustic waveform of the human voice as input and produce an equivalent word string as output [1]. To achieve this result, the voice signal enters a signal processing module in which the vectors with outstanding characteristics are extracted and subsequently sent to the decoder; the decoder uses both an acoustic model and a language model to finally generate the sequence of words that are most likely to resemble the input feature vectors [2]. The acoustic model is essential to define the behavior of the system, this is obtained with speech corpus (voice files that contain the data of a large population of speakers with their corresponding transcription) of voices collected in the same language in which it will be performed. recognition, the more robust the corpus, the better its performance. Although there are several software tools to carry out development with speech recognition, the fact that this project is developed for commands in Spanish limits its choice and finally it is decided to do the development with Microsoft's SAPI, which for this language already has a important development. Other tools such as "Julius" only make available complete acoustic models in Japanese or in a few other languages, mainly English

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Repositorio institucional UAM

Sistema de reconeixement de veu per a domòtica

Author: Bocos Hernández Marta
Serrano García Javier
Universitat Autònoma de Barcelona. Escola d'Enginyeria
Universitat Autònoma de Barcelona. Escola Universitària d'Informàtica
Publication venue
Publication date: 01/01/2011
Field of study

Se discute y se prueba la viabilidad de un sistema reconocedor de voz, así como su integración en una aplicación gráfica que simula una vivienda domótica. Se hace uso de tecnologías de reconocimiento del habla para llevar a cabo la primera parte del proyecto. Para la creación de la interfaz gráfica se utilizan tecnologías gráficas tridimensionales para dar más realismo al simulador.Es discuteix i es prova la viabilitat d'un sistema reconeixedor de veu, així com la seva integració en una aplicació gràfica que simula una vivenda domòtica. S'utilitzen tecnologies de reconeixement de la parla per a portar a terme la primera part del projecte. Per a la creació de la interfície gràfica s'utilitzen tecnologies gràfiques tridimensionals per tal de donar més realisme al simulador

Diposit Digital de Documents de la UAB

Simulador de domótica con interfaz vocal

Author: Serrano García Javier
Universitat Autònoma de Barcelona. Escola d'Enginyeria
Universitat Autònoma de Barcelona. Escola Universitària d'Informàtica
Welton Rodríguez Ander
Publication venue
Publication date: 01/01/2011
Field of study

Automatización de una vivienda consistente en un sistema capaz de reconocer una serie de comandos únicamente teniendo como entrada la señal acústica emitida por el usuario. Se ha optado por realizar un entorno de simulación 3D en el que se recrea una vivienda y el movimiento de un usuario. Los resultados obtenidos de la ejecución de órdenes de voz se pueden apreciar en el propio simulador, viendo en pantalla el resultado que producirían en una casa inteligente con el mismo sistema.Automatització d'una vivenda consistent en un sistema capaç de reconèixer una sèrie de comandes tenint únicament com a entrada el senyal acústic emès per l'usuari. S'ha optat per realitzar un entorn de simulació 3D en el qual es recrea una vivenda i el moviment d'un usuari. Els resultats obtinguts de l'execució d'ordres de veu es poden apreciar en el propi simulador, veient en pantalla el resultat que produirien en una casa intel·ligent amb el mateix sistema

Diposit Digital de Documents de la UAB

Speech recognition based on Spanish accent acoustic model

Author: Cordero Marcos
Cristina Sánchez-Zhunio
Orellana Irene
Salto Johanna
Urigüen María
Zambrano-Martínez Jorge
Publication venue
Publication date: 30/06/2022
Field of study

The objective of the article was to generate an Automatic Speech Recognition (ASR) model based on the translation from human voice to text, being considered as one of the branches of artificial intelligence. Voice analysis allows identifying information about the acoustics, phonetics, syntax, semantics of words, among other elements where ambiguity in terms, pronunciation errors, similar syntax but different semantics can be identified, which represent characteristics of the language. The model focused on the acoustic analysis of words proposing the generation of a methodology for acoustic recognition from speech transcripts from audios containing human voice and the error rate per word was considered to identify the accuracy of the model. The audios were taken from the Integrated Security Service ECU911 that represent emergency calls registered by the entity. The model was trained with the CMUSphinx tool for the Spanish language without internet connection. The results showed that the word error rate varies in relation to the number of audios; that is, the greater the number of audios, the smaller number of erroneous words and the greater the accuracy of the model. The investigation concluded by emphasizing the duration of each audio as a variable that affects the accuracy of the model

Scipedia

The contemporary Judeo-Spanish, between decadence and revitalization. Analysis of contexts, linguistic attitudes and initiatives

Author: Gordón Peral María Dolores
Publication venue: 'Editorial Universidad de Sevilla'
Publication date: 01/01/2018
Field of study

Se ha venido alertando desde mediados del siglo XX sobre la grave crisis que sufre la modalidad judeoespañola en la actualidad, que según algunos va a abocar en su inminente desaparición en no más allá de una o dos generaciones. Empero, desde hace algunos años se están acometiendo iniciativas de diversa índole que pueden desacelerar, si es que no frenar, el proceso de decadencia del sefardí. En esta contribución se atiende primeramente a la compleja situación que ha llevado sobre todo desde finales del siglo XIX al declive del judeoespañol como lengua hablada. Para comprender la paradójica situación actual, se analizan con detenimiento el contexto vital y las actitudes lingüísticas resultantes de algunos hablantes concretos, contextos y actitudes en gran medida contrapuestas que explican de una parte el abandono de esta modalidad y de otra el renovado interés por su transmisión a las nuevas generaciones que suscita en los últimos tiempos, aportando con ello una innovadora visión diastrática prácticamente inédita hasta ahora en la investigación sobre el sefardí. Finalmente, nos centramos en las reacciones que se han producido ante este escenario de decadencia y las iniciativas de todo tipo tomadas en pro de su preservación y aun su revitalización.Abstract It has been warned since the mid-twentieth century about the crisis experienced by the Judeo-Spanish modality at present, which according to some will lead to its imminent disappearance in no more than one or two generations. However, since several years ago of decadence of the Sephardi. In this contribution, attention is first given to the complex situation that has led, above all since the end of the 19th century, to the decline of Judeo- Spanish as a spoken language. In order to understand the paradoxical current situation, the vital context and the linguistic attitudes resulting from some specific speakers, contexts and attitudes that are largely opposed are discussed, explaining on the one hand the abandonment of this modality and on the other the renewed interest in its transmission that this linguistic modality has given rise in recent times among new generations. This contributes an innovative diastratic vision practically unprecedented until now in the research on the Sephardic. Finally, we focus on the reactions that have taken place in the face of this decadent scenario and on the initiatives of all kinds taken in favor of its preservation and even its revitalization

idUS. Depósito de Investigación Universidad de Sevilla

Fernán Caballero y la dialectología andaluza: notas de crítica textual

Author: Ahumada Ignacio
Publication venue: 'Institucion Fernando el Catolico de la Excma. Diputacion de Zaragoza'
Publication date: 01/01/2004
Field of study

Hace ciento cincuenta años que Fernán Caballero publicó Clemencia (1852). Se trata de la primera novela del autor editada como libro. El glosario que cierra la obra constituye, hasta donde alcanzan mis noticias, el acta de nacimiento de la lexicografía andaluza. Es cierto que nos encontramos sólo ante una colección de 38 voces y que, como en todo vocabulario regional que se precie, se registran entradas de dudosa catalogación dialectal; si, por el contrario, atendemos a los guarismos, no es menos cierto que apenas si podemos comparar esta cifra con los doscientos andalucismos que recoge un siglo antes el Diccionario de autoridades. Con todo, este glosario constituye hasta ahora el punto de partida en cuanto tal de la lexicografía regional andaluzaPeer reviewe

Digital.CSIC

The power of collecting through sculpture, comparison between iberian society and present

Author: Romero-Noguera Julio
Ruiz Ruiz María Belén
Publication venue: Universidad de Sevilla, Secretariado de Recursos Audiovisuales y Nuevas Tecnologías
Publication date: 01/01/2017
Field of study

La presente comunicación compara el concepto de coleccionismo entre la sociedad ibérica (siglos VII-I a. C) y la sociedad actual, desde el punto de vista de la representación escultórica. Diferencia la sociedad que crea obras artísticas y quiere exhibirlas, de la sociedad que sólo quiere poseerlas, así como el rol de diferentes tipos de coleccionistas, públicos, privados y desconocidos, y la influencia que ha tenido en ellos el mercado del arte y la práctica del coleccionismo como educación y enriquecimiento cultural de la sociedad.This communication compares the Iberian (6th-1st century BC) concept of collecting to our current behaviors, from the point of view of the sculptural representation. We difference between a society that creates works of art and want to display them, and a society who just wants to possess this kind of objects. The study also deals with the role of different types of collectors (public, private and unknown) and about how have they influenced by the art market, as well as the importance of the practice of collecting as education, in order to promote cultural social values

idUS. Depósito de Investigación Universidad de Sevilla

Desarrollo de un sistema de reconocimiento de habla natural para transcribir contenidos de audio en internet

Author: Perero Codosero Juan Manuel
Publication venue
Publication date: 01/03/2015
Field of study

The aim of this project is to develop a speech recognition system in order to transcribe Internet audiovisual content. First of all, a state of the art research will be carried out to determine the common architecture of speech recognition systems and the use of Hidden Markov Models for this task. After the implementation of a reference system, parameter adjustment and subsequent evaluation, a system optimization will be performed using topic-based language models for the content to recognize. Finally, in order to demonstrate its operation, the optimized system will be applied to a commercial solution enabling the funcionality to be extended. The results of each test are captured in this document, in addition to obtained conclusions.El objetivo de este proyecto es desarrollar un sistema de reconocimiento de habla natural con el fín de transcribir contenidos de audio de Internet. En primer lugar, se realizará un estudio del estado del arte para conocer la arquitectura típica de los sistemas de reconocimiento de voz y el uso de Modelos Ocultos de Markov para esta tarea. Tras la implementación de un sistema de referencia, el ajuste de parámetros y su posterior evaluación, se llevará a cabo una optimización del sistema usando modelos del lenguaje adaptados al tópico de los contenidos a reconocer. Por último, para demostrar su funcionamiento, se aplicará este sistema optimizado a una solución comercial, permitiendo así ampliar su funcionalidad. En esta memoria se recogen los resultados de todas las pruebas y las conclusiones obtenidas

Biblos-e Archivo

Reconocimiento de comandos de voz en español orientado al control de una silla de ruedas

Author: Castillo Ossa Luis Fernando
Flórez Hurtado Rubén Darío
Gil Vásquez Lily Jhohana
Publication venue: 'Universidad Industrial de Santander'
Publication date: 03/03/2016
Field of study

This paper presents a computer application that recognizes Spanish voice command for a speaker independent closed vocabulary. The Spanish language model adopted is the one provided for Microsoft® SAPI (Speech Application Program Interface). This language model was limited to recognize only the grammar related with the functionalities that the user of the automated wheelchair studied by the Automatica research group of the Universidad Autónoma de Manizales can handle. The testing for measure the recognition system performance was implemented discriminately by gender and was developed in three environments with noise level ranges differentiated according the current Colombian legislation about maximum permissible ambient noise levels. It is highlighted that the recognition obtained is speaker independent without requiring the extensive previous training that with other tools should be done.Se presenta una aplicación computacional que reconoce instrucciones de voz en español para un vocabulario cerrado e independiente del hablante, adoptando el modelo de lenguaje que para el español proporciona la SAPI (Interfaz de Programación de Aplicaciones de Voz) de Microsoft®, de manera que reconozca solo la gramática relacionada con las funcionalidades que el usuario de la silla de ruedas automatizada que se trabaja al interior del grupo de investigación de Automática de la Universidad Autónoma de Manizales va a manejar. Las pruebas para medir el desempeño del sistema de reconocimiento se realizan de manera discriminada por género y se desarrollan en tres ambientes con rangos de nivel de ruido diferenciados según la actual legislación Colombiana sobre niveles máximos permisibles de ruido ambiental. Se resalta que el reconocimiento obtenido es independiente del hablante sin necesitar de los extensos entrenamientos previos que con otras herramientas se debe hacer

Universidad Industrial de Santander: Revistas Institucionales UIS

Entrenamiento de Modelo de Voz para Hablantes Hispanos Aplicando Redes Neuronales Convolucionales

Author: Ariza Mariana
Castillo Anthony
Mendoza José
Palacios Jaime
Publication venue: 'Universidad Tecnologica de Panama'
Publication date: 04/06/2018
Field of study

El presente artículo documenta el diseño y desarrollo de un modelo de voz, entrenado mediante redes neuronales convolucionales utilizando TensorFlow, con diez comandos grabados en español hispanohablantes

Repositorio Institucional de la Universidad Tecnológica de Panamá

Portal de Revistas Académicas UTP (Universidad Tecnológica de Panamá)