2 research outputs found
Novel statistical approaches to text classification, machine translation and computer-assisted translation
Esta tesis presenta diversas contribuciones en los campos de la
clasificaci贸n autom谩tica de texto, traducci贸n autom谩tica y traducci贸n
asistida por ordenador bajo el marco estad铆stico.
En clasificaci贸n autom谩tica de texto, se propone una nueva aplicaci贸n
llamada clasificaci贸n de texto biling眉e junto con una serie de modelos
orientados a capturar dicha informaci贸n biling眉e. Con tal fin se
presentan dos aproximaciones a esta aplicaci贸n; la primera de ellas se
basa en una asunci贸n naive que contempla la independencia entre las
dos lenguas involucradas, mientras que la segunda, m谩s sofisticada,
considera la existencia de una correlaci贸n entre palabras en
diferentes lenguas. La primera aproximaci贸n di贸 lugar al desarrollo de
cinco modelos basados en modelos de unigrama y modelos de n-gramas
suavizados. Estos modelos fueron evaluados en tres tareas de
complejidad creciente, siendo la m谩s compleja de estas tareas
analizada desde el punto de vista de un sistema de ayuda a la
indexaci贸n de documentos. La segunda aproximaci贸n se caracteriza por
modelos de traducci贸n capaces de capturar correlaci贸n entre palabras
en diferentes lenguas. En nuestro caso, el modelo de traducci贸n
elegido fue el modelo M1 junto con un modelo de unigramas. Este
modelo fue evaluado en dos de las tareas m谩s simples superando la
aproximaci贸n naive, que asume la independencia entre palabras en
differentes lenguas procedentes de textos biling眉es.
En traducci贸n autom谩tica, los modelos estad铆sticos de traducci贸n
basados en palabras M1, M2 y HMM son extendidos bajo el marco de la
modelizaci贸n mediante mixturas, con el objetivo de definir modelos de
traducci贸n dependientes del contexto. Asimismo se extiende un
algoritmo iterativo de b煤squeda basado en programaci贸n din谩mica,
originalmente dise帽ado para el modelo M2, para el caso de mixturas de
modelos M2. Este algoritmo de b煤squeda nCivera Saiz, J. (2008). Novel statistical approaches to text classification, machine translation and computer-assisted translation [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/2502Palanci