Location of Repository

Una manera sencilla para usar fuentes de información bilingüe para el alineamiento de palabras

By Miquel Esplà-Gomis, Felipe Sánchez-Martínez and Mikel L. Forcada

Abstract

En este artículo se describe un método nuevo y sencillo para utilizar fuentes de información bilingüe para el alineamiento de palabras en segmentos de texto paralelos. Este método puede ser utilizado al vuelo, ya que no requiere de entrenamiento. Además, puede ser utilizado con corpus comparables. Hemos comparado los resultados de nuestro método con los obtenidos por la herramienta GIZA++, ampliamente utilizada para el alineamiento de palabras, obteniendo unos resultados bastante similares.In this paper we present a new and simple method for using sources of bilingual information for word alignment between parallel segments of text. This method can be used on the fly, since it does not need to be trained. In addition, it can also be applied on comparable corpora. We compare our method to the state-of-the-art tool GIZA++, widely used for word alignment, and we obtain very similar results.Work supported by the Spanish government through project TIN2009-14009-C02-01 and by Universitat d'Alacant through project GRE11-20

Topics: Alineamiento de palabras, Fuentes de información bilingüe, Word alignment, Sources of bilingual information, Lenguajes y Sistemas Informáticos
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Year: 2012
OAI identifier: oai:rua.ua.es:10045/23924
Journal:

Suggested articles

Preview


To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.