3 research outputs found

    Novel statistical approaches to text classification, machine translation and computer-assisted translation

    Full text link
    Esta tesis presenta diversas contribuciones en los campos de la clasificaci贸n autom谩tica de texto, traducci贸n autom谩tica y traducci贸n asistida por ordenador bajo el marco estad铆stico. En clasificaci贸n autom谩tica de texto, se propone una nueva aplicaci贸n llamada clasificaci贸n de texto biling眉e junto con una serie de modelos orientados a capturar dicha informaci贸n biling眉e. Con tal fin se presentan dos aproximaciones a esta aplicaci贸n; la primera de ellas se basa en una asunci贸n naive que contempla la independencia entre las dos lenguas involucradas, mientras que la segunda, m谩s sofisticada, considera la existencia de una correlaci贸n entre palabras en diferentes lenguas. La primera aproximaci贸n di贸 lugar al desarrollo de cinco modelos basados en modelos de unigrama y modelos de n-gramas suavizados. Estos modelos fueron evaluados en tres tareas de complejidad creciente, siendo la m谩s compleja de estas tareas analizada desde el punto de vista de un sistema de ayuda a la indexaci贸n de documentos. La segunda aproximaci贸n se caracteriza por modelos de traducci贸n capaces de capturar correlaci贸n entre palabras en diferentes lenguas. En nuestro caso, el modelo de traducci贸n elegido fue el modelo M1 junto con un modelo de unigramas. Este modelo fue evaluado en dos de las tareas m谩s simples superando la aproximaci贸n naive, que asume la independencia entre palabras en differentes lenguas procedentes de textos biling眉es. En traducci贸n autom谩tica, los modelos estad铆sticos de traducci贸n basados en palabras M1, M2 y HMM son extendidos bajo el marco de la modelizaci贸n mediante mixturas, con el objetivo de definir modelos de traducci贸n dependientes del contexto. Asimismo se extiende un algoritmo iterativo de b煤squeda basado en programaci贸n din谩mica, originalmente dise帽ado para el modelo M2, para el caso de mixturas de modelos M2. Este algoritmo de b煤squeda nCivera Saiz, J. (2008). Novel statistical approaches to text classification, machine translation and computer-assisted translation [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/2502Palanci

    Computer-assisted translation using finite-state transducers

    Get PDF
    Traducci贸n asistida por ordenador (CAT) es una aproximaci贸n alternativa a la traducci贸n autom谩tica que integra el conocimiento humano en el proceso de la traducci贸n autom谩tica. En este marco, un traductor interact煤a con un sistema de traducci贸n que din谩micamente ofrece una lista de traducciones que mejor completan la parte de oraci贸n ya traducida. La tecnolog铆a de transductores estoc谩sticos de estados finitos se propone para dar apoyo a este sistema CAT. Este sistema fue evaluado en dos tareas reales de diferente complejidad en varias lenguas.Computer-Assisted Translation (CAT) is an alternative approach to machine translation, that integrates human expertise into the automatic translation process. In this framework, a human translator interacts with a translation system that dynamically offers a list of translations that best completes the part of the sentence already translated. Stochastic finite-state transducer technology is proposed to support this CAT system. The system was assessed on two real tasks of different complexity in several languages.This work has been supported by the the Spanish CICYT project TIC2003-08681-C02
    corecore