Universidade do Minho. Centro de Estudos Humanísticos (CEHUM)
Abstract
In this article an evaluation of a method for extracting restricted lexical combinations from parallel corpora by detecting non-compositionality of multiword expressions in translation will be presented. This method presupposes that by finding sequences of words whose translation does not follow a simple word-to-word conversion of the component words, a collocation is probably present. Word bigrams are used.Neste artigo apresentamos uma avaliação sobre um método para extrair combinações
lexicais restritas a partir de corpora paralelos, pela deteção da não composicionalidade
de expressões pluriverbais na tradução. Este método baseia-se na presunção de que,
encontrando sequências de palavras cuja tradução não siga a tradução palavra por
palavra dos seus componentes, é provável estar-se perante uma colocação. São usadas
palavras brigrama.info:eu-repo/semantics/publishedVersio