3 research outputs found
Novel statistical approaches to text classification, machine translation and computer-assisted translation
Esta tesis presenta diversas contribuciones en los campos de la
clasificaci贸n autom谩tica de texto, traducci贸n autom谩tica y traducci贸n
asistida por ordenador bajo el marco estad铆stico.
En clasificaci贸n autom谩tica de texto, se propone una nueva aplicaci贸n
llamada clasificaci贸n de texto biling眉e junto con una serie de modelos
orientados a capturar dicha informaci贸n biling眉e. Con tal fin se
presentan dos aproximaciones a esta aplicaci贸n; la primera de ellas se
basa en una asunci贸n naive que contempla la independencia entre las
dos lenguas involucradas, mientras que la segunda, m谩s sofisticada,
considera la existencia de una correlaci贸n entre palabras en
diferentes lenguas. La primera aproximaci贸n di贸 lugar al desarrollo de
cinco modelos basados en modelos de unigrama y modelos de n-gramas
suavizados. Estos modelos fueron evaluados en tres tareas de
complejidad creciente, siendo la m谩s compleja de estas tareas
analizada desde el punto de vista de un sistema de ayuda a la
indexaci贸n de documentos. La segunda aproximaci贸n se caracteriza por
modelos de traducci贸n capaces de capturar correlaci贸n entre palabras
en diferentes lenguas. En nuestro caso, el modelo de traducci贸n
elegido fue el modelo M1 junto con un modelo de unigramas. Este
modelo fue evaluado en dos de las tareas m谩s simples superando la
aproximaci贸n naive, que asume la independencia entre palabras en
differentes lenguas procedentes de textos biling眉es.
En traducci贸n autom谩tica, los modelos estad铆sticos de traducci贸n
basados en palabras M1, M2 y HMM son extendidos bajo el marco de la
modelizaci贸n mediante mixturas, con el objetivo de definir modelos de
traducci贸n dependientes del contexto. Asimismo se extiende un
algoritmo iterativo de b煤squeda basado en programaci贸n din谩mica,
originalmente dise帽ado para el modelo M2, para el caso de mixturas de
modelos M2. Este algoritmo de b煤squeda nCivera Saiz, J. (2008). Novel statistical approaches to text classification, machine translation and computer-assisted translation [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/2502Palanci
Computer-assisted translation using finite-state transducers
Traducci贸n asistida por ordenador (CAT) es una aproximaci贸n alternativa
a la traducci贸n autom谩tica que integra el conocimiento humano en el proceso
de la traducci贸n autom谩tica. En este marco, un traductor interact煤a con un sistema
de traducci贸n que din谩micamente ofrece una lista de traducciones que mejor completan
la parte de oraci贸n ya traducida. La tecnolog铆a de transductores estoc谩sticos
de estados finitos se propone para dar apoyo a este sistema CAT. Este sistema fue
evaluado en dos tareas reales de diferente complejidad en varias lenguas.Computer-Assisted Translation (CAT) is an alternative approach to
machine translation, that integrates human expertise into the automatic translation
process. In this framework, a human translator interacts with a translation system
that dynamically offers a list of translations that best completes the part of the sentence
already translated. Stochastic finite-state transducer technology is proposed
to support this CAT system. The system was assessed on two real tasks of different
complexity in several languages.This work has been supported by the the Spanish
CICYT project TIC2003-08681-C02