15 research outputs found

    Idiom treatment experiments in machine translation

    Get PDF
    Idiomatic expressions pose a particular challenge for the today\u27;s Machine Translation systems, because their translation mostly does not result literally, but logically. The present dissertation shows, how with the help of a corpus, and morphosyntactic rules, such idiomatic expressions can be recognized and finally correctly translated. The work leads the reader in the first chapter generally to the field of Machine Translation and following that, it focuses on the special field of Example-based Machine Translation. Next, an important part of the doctoral thesis dissertation is devoted to the theory of idiomatic expressions. The practical part of the thesis describes how the hybrid Example-based Machine Translation system METIS-II, with the help of morphosyntactic rules, is able to correctly process certain idiomatic expressions and finally, to translate them. The following chapter deals with the function of the transfer system CAT2 and its handling of the idiomatic expressions. The last part of the thesis includes the evaluation of three commercial systems, namely SYSTRAN, T1 Langenscheidt, and Power Translator Pro, with respect to continuous and discontinuous idiomatic expressions. For this, both small corpora and a part of the extensive corpus Europarl and the Digital Lexicon of the German Language in 20th century were processed, firstly manually and then automatically. The dissertation concludes with results from this evaluation.Idiomatische Redewendungen stellen fĂŒr heutige maschinelle Übersetzungssysteme eine besondere Herausforderung dar, da ihre Übersetzung nicht wörtlich, sondern stets sinngemĂ€ĂŸ erfolgen muss. Die vorliegende Dissertation zeigt, wie mit Hilfe eines Korpus sowie morphosyntaktischer Regeln solche idiomatische Redewendungen erkannt und am Ende richtig ĂŒbersetzt werden können. Die Arbeit fĂŒhrt den Leser im ersten Kapitel allgemein in das Gebiet der Maschinellen Übersetzung ein und vertieft im Anschluss daran das Spezialgebiet der Beispielbasierten Maschinellen Übersetzung. Im Folgenden widmet sich ein wesentlicher Teil der Doktorarbeit der Theorie ĂŒber idiomatische Redewendungen. Der praktische Teil der Arbeit beschreibt wie das hybride Beispielbasierte Maschinelle Übersetzungssystem METIS-II mit Hilfe von morphosyntaktischen Regeln befĂ€higt wurde, bestimmte idiomatische Redewendungen korrekt zu bearbeiten und am Ende zu ĂŒbersetzen. Das nachfolgende Kapitel behandelt die Funktion des Transfersystems CAT2 und dessen Umgang mit idiomatischen Wendungen. Der letzte Teil der Arbeit beinhaltet die Evaluation von drei kommerzielle Systemen, nĂ€mlich SYSTRAN, T1 Langenscheidt und Power Translator Pro, in Bezug auf deren Umgang mit kontinuierlichen und diskontinuierlichen idiomatischen Redewendungen. Hierzu wurden sowohl kleine Korpora als auch ein Teil des umfangreichen Korpus Europarl und des Digatalen Wörterbuchs der deutschen Sprache des 20. Jh. erst manuell und dann maschinell bearbeitet. Die Dissertation wird mit Folgerungen aus der Evaluation abgeschlossen

    Natural language software registry (second edition)

    Get PDF

    Report of the EAGLES Workshop on Implemented Formalisms at DFKI, SaarbrĂŒcken

    Get PDF

    Report of the EAGLES Workshop on Implemented Formalisms at DFKI, SaarbrĂŒcken

    Get PDF

    A morphosyntactic processor of modern standard Arabic

    Get PDF

    An Investigation into Automatic Translation of Prepositions in IT Technical Documentation from English to Chinese

    Get PDF
    Machine Translation (MT) technology has been widely used in the localisation industry to boost the productivity of professional translators. However, due to the high quality of translation expected, the translation performance of an MT system in isolation is less than satisfactory due to various generated errors. This study focuses on translation of prepositions from English into Chinese within technical documents in an industrial localisation context. The aim of the study is to reveal the salient errors in the translation of prepositions and to explore possible methods to remedy these errors. This study proposes three new approaches to improve the translation of prepositions. All approaches attempt to make use of the strengths of the two most popular MT architectures at the moment: Rule-Based MT (RBMT) and Statistical MT (SMT). The approaches include: firstly building an automatic preposition dictionary for the RBMT system; secondly exploring and modifing the process of Statistical Post-Editing (SPE) and thirdly pre-processing the source texts to better suit the RBMT system. Overall evaluation results (both human evaluation and automatic evaluation) show the potential of our new approaches in improving the translation of prepositions. In addition, the current study also reveals a new function of automatic metrics in assisting researchers to obtain more valid or purpose-specific human valuation results

    TOTh 2013 Proceedings - Terminology & Ontology: Theories and applications

    Get PDF
    International audienceAvant-proposLa Terminologie est une discipline scientifique qui puise Ă  de nombreux domaines dont la linguistique, la thĂ©orie de la connaissance et la logique. Pour que cette diversitĂ© soit une richesse, il faut lui offrir un cadre appropriĂ© au sein duquel elle puisse s’exprimer et s’épanouir : c’est une des raisons d’ĂȘtre des ConfĂ©rences TOTh. Dans ce contexte, la formation et la transmission des connaissances jouent un rĂŽle essentiel. La Formation TOTh, programmĂ©e sur un jour et demi prĂ©cĂ©dant la confĂ©rence, se dĂ©roule depuis 2011 sur deux annĂ©es consĂ©cutives dĂ©diĂ©es pour l’une Ă  la dimension linguistique et pour l’autre Ă  la dimension conceptuelle de la terminologie, deux dimensions Ă©troitement liĂ©es. La Disputatio, introduite en 2011, renoue avec une forme d’enseignement et de recherche hĂ©ritĂ©e de la scolastique. Elle vise, Ă  travers une lecture commentĂ©e effectuĂ©e par un membre du comitĂ© scientifique, Ă  donner accĂšs Ă  des auteurs et Ă  des textes jugĂ©s fondateurs pour notre domaine : l’IsagogĂš de Porphyre en 2011, terminologie et variation chez WĂŒster en 2012 et l’apport de Saussure Ă  la Terminologie cette annĂ©e.Notre collĂšgue François Rastier, directeur de recherche CNRS, a ouvert la ConfĂ©rence TOTh 2013 par un exposĂ© sur « Ontologie et rĂ©fĂ©rence » qui a donnĂ© lieu, on s’en doutait, Ă  de nombreux Ă©changes. On lira avec intĂ©rĂȘt son article qui ne peut, en tant que terminologues, que nous interpeller.Les diffĂ©rentes communications ont permis d’aborder en profondeur – chaque intervention dure 45 minutes – de nombreux sujets tant thĂ©oriques que pratiques rappelant qu’il ne peut y avoir de Terminologie sans langue ni savoir de spĂ©cialitĂ©. Je vous invite Ă  les dĂ©couvrir Ă  travers ces actes.Avant de vous souhaiter bonne lecture, j’aimerais terminer en remerciant tous les participants pour la richesse des dĂ©bats et des moments partagĂ©s.Christophe RochePrĂ©sident du comitĂ© scientifiqu
    corecore