research

XML :: TMX : processamento de memórias de tradução de grandes dimensões

Abstract

As ferramentas de tradução assistida por computador tentam reutilizar as traduções realizadas pelo tradutor sempre que uma frase semelhante tenha sido já traduzida. Para o intercâmbio destes documentos foi definido um formato denominado TMX (Translation Memory Exchange) baseado em XML. Este tipo de documento ganha facilmente tamanhos incomportáveis para o seu processamento com métodos tradicionais. Neste artigo propomos uma metodologia de ordem superior para o processamento de documentos de estrutura repetitiva (em que se inserem as memórias de tradução) com uma abordagem baseada na conjunção de SAX e DOM. São apresentados vários exemplos de filtros sobre memórias de tradução bem como um conjunto de medidas da sua eficiência.Este trabalho foi parcialmente financiado pela Fundação para a Ciência e Tecnologia de Portugal pela bolsa POSI/PLP/43931/2001, e co-financiado pelo POSI, dentro da Linguateca

    Similar works