984 research outputs found

    Aplicación de métodos estadísticos para la traducción de voz a Lengua de Signos

    Get PDF
    Este artículo presenta un conjunto de experimentos para la realización de un sistema de traducción estadística de voz a lengua de signos para personas sordas. El sistema contiene un primer módulo de reconocimiento de voz, un segundo módulo de traducción estadística de palabras en castellano a signos en Lengua de Signos Española, y un tercer módulo que realiza el signado de los signos mediante un agente animado. La traducción se hace utilizando dos alternativas tecnológicas: la primera basada en modelos de subsecuencias de palabras y la segunda basada en transductores de estados finitos. De todos los experimentos, se obtienen los mejores resultados con el modelo que realiza la traducción mediante transductores de estados finitos con unas tasas de error de 26,06% para las frases de referencia, de 33,42% para la salida del reconocedor

    Implementación de un sistema de traducción automática basado en modelos estadísticos para la traducción de la lengua de señas colombiana al español

    Get PDF
    Los humanos, en condición de seres sociales, necesitan comunicarse. La comunicación es el intercambio de ideas mediante un código de conocimiento mutuo. No siempre la comunicación se da de forma exitosa, existen condiciones que limitan el proceso comunicativo tales como: la codificación del mensaje (idiomas o lenguas) o las habilidades limitadas de transmisión o emisión, como es el caso de las discapacidades sensoriales. Las discapacidades sensoriales son la ceguera, sordera y dificultad del habla. La disminución gradual o total de la capacidad auditiva es uno de los factores que influye en el aprendizaje de la lengua, lo que conlleva a buscar formas alternativas de comunicación como lo es la lengua de señas. Para el caso de los sordos colombianos, la Lengua de Señas Colombiana (LSC) es una lengua transmitida por medio del movimiento de las extremidades superiores y representada de forma escrita por glosas. La LSC es un código de comunicación para la población no oyente, pero actualmente, existen dificultades para entablar una comunicación efectiva con las personas oyentes, debido a que un alto porcentaje de la población colombiana no conoce o no sabe la LSC. Dicha problemática trasciende en temas como lo es el acceso a la educación, ya que en los centros educativos no se cuenta con suficientes intérpretes que abarquen todos los puntos y aulas de la instalación

    Estudio del tipo de alineamiento en un sistema de traducción estadística de castellano a Lengua de Signos Española (LSE)

    Full text link
    La principal aportación de este artículo es el estudio del efecto que tiene el tipo de alineamiento en un sistema de traducción estadística de castellano a Lengua de Signos Española (LSE). El sistema de traducción utiliza un modelo de traducción basado en subfrases o secuencias de palabras. El artículo describe el ajuste de los parámetros de configuración de este sistema para el problema de traducción concreto (castellano-LSE), siendo la selección del tipo de alineamiento un aspecto crítico en los resultados de traducción obtenidos. La selección del tipo de alineamiento se define en el proceso de generación del modelo de traducción basado en palabras como paso previo a la generación del modelo de secuencias de palabras. La evaluación de la arquitectura se realiza con varias métricas: WER (tasa de error de palabras), BLEU (“BiLingual Evaluation Understudy”) y NIST. Finalmente, los resultados que se obtienen dan una tasa de error de 28,29%, consiguiendo una reducción relativa de más de un 35% en dicha tasa de error

    Sistema de Traducción Estadística de Voz a Lengua de Signos para Personas Sordas

    Get PDF
    Este artículo presenta un conjunto de experimentos para la realización de un sistema de traducción estadística de voz a lengua de signos para personas sordas. Éste contiene un módulo de reconocimiento de voz, uno de traducción estadística de palabras en castellano a signos en Lengua de Signos Española, y un tercer módulo que representa los signos mediante un avatar. La traducción se hace mediante dos alternativas tecnológicas: la primera basada en modelos de subsecuencias de palabras y la segunda basada en transductores de estados finitos. Para la evaluación se utilizan varias métricas, como WER (tasa de error de palabras), BLEU y NIST. Estas pruebas incluyen experimentos con las frases originales en castellano y Lengua de Signos y con frases extraídas del reconocedor de voz. Se evalúan también diferentes situaciones del reconocedor de voz a la hora de obtener el vocabulario y el modelo de lenguaje. Los mejores resultados se obtienen con la traducción mediante transductores de estados finitos dando unas tasas de error de 28,21% para las frases de referencia, y de 29,27% la salida del reconocedor

    Machine translation based on neural network language models

    Get PDF
    Este trabajo describe un sistema de traducción que integra n-gramas conexionistas en la etapa de decodificación, motivado por los buenos resultados obtenidos en los últimos años usando estos modelos de lenguaje. Hasta el momento todos los resultados publicados delegan el modelo de lenguaje conexionista a una segunda etapa desacoplada en la que se repuntúan listas de N-best o bien se utilizan sobre grafos de palabras que contienen las N-best. Nuestro objetivo es mostrar la viabilidad de utilizar estos modelos de lenguaje dentro de un sistema totalmente acoplado.This paper describes a Machine Translation system that integrates a Neural Network Language Model in the decoding process. This work is motivated by the excellent performance of these connectionist language models. So far, the use of Neural Network Language Models in the translation systems is uncoupled: they are used in a second stage to rerank a N-best hypothesis list or to parse a word graph containing the N-best list. Our goal is to show the feasibility of using these language models within a fully integrated system

    Modelo estocástico de traducción basado en N-gramas de tuplas bilingües y combinación log-lineal de características

    Get PDF
    En esta comunicación se presenta un sistema de traducción estocástica basado en el modelado mediante N-gramas de la probabilidad conjunta de textos bilingües. La unidad básica del modelo es la tupla, par de cadenas de palabras del lenguaje fuente (a traducir) y el lenguaje destino (traducción). La traducción se lleva a cabo mediante la maximización de una combinación lineal de los logaritmos de la probabilidad asignada a la traducción por el modelo de traducción y otras características, siguiendo la aproximación de entropía máxima. Las prestaciones del sistema de traducción son evaluadas con una tarea de traducción del habla: la traducción entre inglés y español (y viceversa) de transcripciones de intervenciones de los miembros del Parlamento Europeo. Los resultados alcanzados se encuentran al nivel del estado del arte.This communication introduces a stochastic machine translation system based on Ngram modelling of the joint probability of bilingual texts. The basic unit of this model is called a tuple and consists of a pair of both source (to be translated) language and target language (translation) word-strings. Translation is driven by a log-linear combination of the N-gram model probability and other features, according to the maximum entropy language modelling approach. The translation performance is evaluated by means of a speech-to-speech translation tasks: translation from Spanish to English (and viceversa) of European Parliament speeches. The system reaches a state-of-art performance.Este trabajo ha sido financiado parcialmente por la CICYT a través del proyecto TIC2002-04447-C02 (ALIADO) y la Unión Europea mediante el proyecto FP6-506738 (TC-STAR)

    Hibridación en lenguas distantes

    Full text link
    [ES] Aplicación de reglas a sistemas de traducción automáticos estadísticos en lenguas gramaticalmente muy distintas[EN] Application of rules to statistical machine translation systems in grammatically very different languagesHelle Salcedo, AJ. (2013). Hibridación en lenguas distantes. http://hdl.handle.net/10251/37112Archivo delegad

    Incorporación de información sintáctico-semántica en la traducción de voz a lengua de signos

    Get PDF
    Este artículo presenta un conjunto de experimentos para evaluar la mejora obtenida cuando se incorpora información sintáctico-semántica en la traducción estadística de voz a lengua de signos. La traducción se realiza utilizando dos alternativas tecnológicas: la primera basada en modelos de subsecuencias de palabras y la segunda basada en traductores de estados finitos (“FST”). En cuanto a la evaluación de dichos resultados, se utilizan varias métricas, como WER (tasa de error de palabras), BLEU y NIST. Las pruebas realizadas incluyen experimentos con las frases de referencia en castellano y Lengua de Signos y con frases obtenidas del reconocedor de voz. Para evaluar la mejora obtenida se muestran los resultados con y sin información sintáctico-semántica. Los mejores resultados se obtuvieron con la solución de traductores de estados finitos con unas tasas de error de 26,06% para las frases de referencia y de 33,01% para las salidas del reconocedor cuando se incorpora información sintáctico-semántica

    Traducción automática, análisis, contraste y aceptación

    Get PDF
    Treball Final de Grau en Traducció i Interpretació. Codi: TI0983. Curs: 2014/2015Este proyecto gira en torno a la investigación y aceptación de la traducción automática en diferentes tipologías textuales (expresiva, informativa y operativa). Como parte del estudio, se presenta un análisis mediante el Baremo de corrección de traducciones utilizado en la Universitat Jaume I para estudiar los errores que comete una herramienta de traducción automática, y otro análisis contrastivo mediante el método WER para determinar la calidad de la traducción automática en comparación con la traducción profesional. Asimismo, y a modo investigación social, se diseña y aplica una encuesta a un amplio abanico de receptores para determinar el grado de aceptación de las herramientas de traducción automática actuales y el nivel de confianza que se deposita en ellas. En dicha encuesta, aparecen diferentes preguntas respecto a la traducción automática para concretar la opinión que el público tiene acerca de la profesión de la traducción y las nuevas tecnologías aplicadas a la traducción
    corecore