1 research outputs found

    Novel statistical approaches to text classification, machine translation and computer-assisted translation

    Full text link
    Esta tesis presenta diversas contribuciones en los campos de la clasificaci贸n autom谩tica de texto, traducci贸n autom谩tica y traducci贸n asistida por ordenador bajo el marco estad铆stico. En clasificaci贸n autom谩tica de texto, se propone una nueva aplicaci贸n llamada clasificaci贸n de texto biling眉e junto con una serie de modelos orientados a capturar dicha informaci贸n biling眉e. Con tal fin se presentan dos aproximaciones a esta aplicaci贸n; la primera de ellas se basa en una asunci贸n naive que contempla la independencia entre las dos lenguas involucradas, mientras que la segunda, m谩s sofisticada, considera la existencia de una correlaci贸n entre palabras en diferentes lenguas. La primera aproximaci贸n di贸 lugar al desarrollo de cinco modelos basados en modelos de unigrama y modelos de n-gramas suavizados. Estos modelos fueron evaluados en tres tareas de complejidad creciente, siendo la m谩s compleja de estas tareas analizada desde el punto de vista de un sistema de ayuda a la indexaci贸n de documentos. La segunda aproximaci贸n se caracteriza por modelos de traducci贸n capaces de capturar correlaci贸n entre palabras en diferentes lenguas. En nuestro caso, el modelo de traducci贸n elegido fue el modelo M1 junto con un modelo de unigramas. Este modelo fue evaluado en dos de las tareas m谩s simples superando la aproximaci贸n naive, que asume la independencia entre palabras en differentes lenguas procedentes de textos biling眉es. En traducci贸n autom谩tica, los modelos estad铆sticos de traducci贸n basados en palabras M1, M2 y HMM son extendidos bajo el marco de la modelizaci贸n mediante mixturas, con el objetivo de definir modelos de traducci贸n dependientes del contexto. Asimismo se extiende un algoritmo iterativo de b煤squeda basado en programaci贸n din谩mica, originalmente dise帽ado para el modelo M2, para el caso de mixturas de modelos M2. Este algoritmo de b煤squeda nCivera Saiz, J. (2008). Novel statistical approaches to text classification, machine translation and computer-assisted translation [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/2502Palanci
    corecore