3 research outputs found
Flexible statistical construction of bilingual dictionaries
La mayorÃa de los sistemas previos para construir un diccionario bilingüe a partir de un
corpus paralelo dependen de un algoritmo iterativo, usando probabilidades de traducción de palabras
para alinear palabras en el corpus y sus alineamientos para estimar probabilidades de traducción,
repitiendo hasta la convergencia. Si bien este enfoque produce resultados razonables, es
computacionalmente lento, limitando el tamaño del corpus que se puede analizar y el del diccionario
producido. Nosotros proponemos una aproximación no iterativa para producir un diccionario
bilingüe unidireccional que, si bien menos precisa que las aproximaciones iterativas, es mucho
más rápida, permitiendo procesar córpora mayores en un tiempo razonable. Asimismo, permite
una estimación en tiempo real de la probabilidad de traducción de un par de términos, lo que significa
que permite obtener un diccionario de traducción con los n términos más frecuentes, y calcular
las probabilidades de traducción de términos infrecuentes cuando se encuentren en documentos
reales.Most previous systems for constructing a bilingual dictionary from a parallel corpus
have depended on an iterative algorithm, using word translation probabilities to align words in the
corpus, and using word alignments to estimate word translation probabilities, and repeating until
convergence. While this approach produces reasonable results, it is computationally slow, limiting
the size of the corpus that can be analysed and the size of the dictionary produced. We propose a
non-iterative approach for producing a uni-directional bilingual dictionary which, while less
accurate than iterative approaches, is far quicker, allowing larger corpora to be processed in
reasonable time. The approach also allows on-the-fly estimation of translation likelihoods between
a pair of terms, meaning that a translation dictionary can be generated with the n most frequent
terms in an initial pass, and the translation likelihood of infrequent terms can be calculated as
encountered in real documents
Una metodologÃa para gestión de la interacción entre los estudiantes, los profesores y el contenido en aplicaciones en lÃnea de aprendizaje hibrido usando modelos conceptuales
Tesis doctoral inédita. Universidad Autónoma de Madrid, Escuela Politécnica Superior, junio de 200
Procesamiento del Lenguaje Natural, nº39 (2007), pp. 249-255 recibido 18-05-2007; aceptado 22-06-2007 Flexible statistical construction of bilingual dictionaries
Resumen: La mayorÃa de los sistemas previos para construir un diccionario bilingüe a partir de un corpus paralelo dependen de un algoritmo iterativo, usando probabilidades de traducción de palabras para alinear palabras en el corpus y sus alineamientos para estimar probabilidades de traducción, repitiendo hasta la convergencia. Si bien este enfoque produce resultados razonables, es computacionalmente lento, limitando el tamaño del corpus que se puede analizar y el del diccionario producido. Nosotros proponemos una aproximación no iterativa para producir un diccionario bilingüe unidireccional que, si bien menos precisa que las aproximaciones iterativas, es mucho más rápida, permitiendo procesar córpora mayores en un tiempo razonable. Asimismo, permite una estimación en tiempo real de la probabilidad de traducción de un par de términos, lo que significa que permite obtener un diccionario de traducción con los n términos más frecuentes, y calcular las probabilidades de traducción de términos infrecuentes cuando se encuentren en documentos reales. Palabras clave: diccionarios bilingües, modelos palabra-a-palabra, traducción automática estadÃstica Abstract: Most previous systems for constructing a bilingual dictionary from a parallel corpus have depended on an iterative algorithm, using word translation probabilities to align words in th