1 research outputs found

    Identification d'erreurs de traduction dans un dictionnaire de recherche d'informations translingue et traduction de mots composés à l'aide du World Wide Web

    Get PDF
    International audienceRÉSUMÉ. La recherche d'informations translingue sur des textes non parallĂšles nĂ©cessite une phase de traduction entre une requĂȘte dans une langue source et un document dans une langue cible. Afin d'obtenir les mĂȘmes performances que dans le cas d'une requĂȘte monolingue sur un document dans la mĂȘme langue que cette requĂȘte, il est nĂ©cessaire de trouver les bonnes traductions pour tous les termes de la requĂȘte en langue source. Malheureusement, les dictionnaires de traduction disponibles ne contiennent pas les traduc-tions exactes d'un grand nombre de mots composĂ©s qui peuvent ĂȘtre prĂ©sents dans une requĂȘte. Les systĂšmes de recherche translingues utilisent des dictionnaires de traduction construits sta-tistiquement ou manuellement. Afin de traduire un mot composĂ©, beaucoup de ces systĂšmes gĂ©nĂšrent toutes les traductions possibles mot Ă  mot et vĂ©rifient la prĂ©sence de ces traductions dans la base de donnĂ©e cible. La qualitĂ© de la recherche augmente lorsque il est possible d'uti-liser des traductions de mots composĂ©s prĂ©alablement validĂ©es. Il reste cependant deux problĂšmes encore non rĂ©solus avec cette mĂ©thode consistant Ă  gĂ©nĂ©rer et Ă  valider toutes les traductions : (1) Si la traduction exacte d'un Ă©lĂ©ment d'un mot composĂ© ne figure pas dans le dictionnaire de traduction, la traduction qui sera validĂ©e par cette mĂ©-thode ne sera pas la meilleure traduction. (2) Si la bonne traduction ne comprend pas le mĂȘme nombre d'Ă©lĂ©ments que le mot composĂ© source, la meilleure traduction ne sera pas non plus gĂ©nĂ©rĂ©e. Dans cet article, nous proposons deux mĂ©thodes pour identifier ces situations. ABSTRACT. Cross-language information retrieval over non parallel text requires a translation phase between a source language query and a target language document. In order to achieve the same performance as a monolingual target language query, good translations for all terms CORIA 05 France-Grenoble-9-11 mars 200
    corecore