207 research outputs found

    Automated Translation with Interlingual Word Representations

    Get PDF
    In dit proefschrift onderzoeken we het gebruik vertaalsystemen die gebruiken maken van een transferfase met interlinguale representaties van woorden. Op deze manier benaderen we het probleem van de lexicale ambiguïteit in de automatische vertaalsystemen als twee afzonderlijke taken: het bepalen van woordbetekenis en lexicale selectie. Eerst worden de woorden in de brontaal op basis van hun betekenis gedesambigueerd, resulterend in interlinguale representaties van woorden. Vervolgens wordt een lexicale selectiemodule gebruikt die het meest geschikte woord in de doeltaal selecteert. We geven een gedetailleerde beschrijving van de ontwikkeling en evaluatie van vertaalsystemen voor Nederlands-Engels. Dit biedt een achtergrond voor de experimenten in het tweede en derde deel van dit proefschrift. Daarna beschrijven we een methode die de betekenis van woorden bepaalt. Deze is vergelijkbaar met het klassieke Lesk-algoritme, omdat het gebruik maakt van het idee dat gedeelde woorden tussen de context van een woord en zijn definitie informatie over de betekenis ervan verschaffen. Wij gebruiken echter, in plaats daarvan, woord- en betekenisvectoren om de overeenkomst te berekenen tussen de definitie van een betekenis en de context van een woord. We gebruiken onze methode bovendien voor het localiseren en -interpreteren van woordgrapjes.Ten slotte presenteren we een model voor lexicale keuze dat lemma's selecteert, gegeven de abstracte representaties van woorden. Dit doen we door de grammaticale bomen te converteren naar hidden Markov bomen. Op deze manier kan de optimale combinatie van lemmas en hun context berekend worden

    Automated Translation with Interlingual Word Representations

    Get PDF

    Evaluation of an Esperanto-Based Interlingua Multilingual Survey Form Machine Translation Mechanism Incorporating a Sublanguage Translation Methodolgy

    Get PDF
    Translation costs restrict the preparation of medical survey and other questionnaires for migrant communities in Western Australia. This restriction is compounded by a lack of affordable and accurate machine translation mechanisms. This research investigated and evaluated combined strategies intended to provide an efficacious and affordable machine translator by: • using an interlingua or pivot-language that requires less resources for its construction than contemporary systems and has the additional benefit of significant error reduction; and • defining smaller lexical environments to restrict data, thereby reducing the complexity of translation rules and enhancing correct semantic transfer between natural languages. This research focussed on producing a prototype machine translation mechanism that would accept questionnaire texts as discrete questions and suggested answers from which a respondent may select. The prototype was designed to accept non-ambiguous English as the source language, translate it to a pivot-language or interlingua, Esperanto, and thence to a selected target language, French. Subsequently, a reverse path of translation from the target language back to the source language enabled validation of minimal or zero change in both syntax and semantics of the original input. Jade, an object-oriented (00) database application, hosting the relationship between the natural languages and the interlingua, was used to facilitate the accurate transfer of meaning between the natural languages. Translation, interpretation and validation of sample texts was undertaken by linguists qualified in English, French and Esperanto. Translation output from the prototype model was compared, again with assistance from linguists, with a \u27control\u27 model, the SYSTRAN On-Line Translator, a more traditional transfer translation product. Successful completion of this research constitutes a step towards an increased availability of low cost machine translation to assist in the development of reliable and efficient survey translation systems for use in specific user environments. These environments include, but arc not exclusive to, medical, hospital and Australian indigenous-contact environments
    • …
    corecore