La traduzione delle polirematiche
richiede la conoscenza del corretto equivalente
nella lingua di arrivo che raramente è il risultato
di una traduzione letterale. Questo
contributo si basa sul presupposto che il corretto
trattamento delle polirematiche in applicazioni
di Trattamento Automatico del Linguaggio
(TAL) ed in particolare di Traduzione
Automatica e nelle tecnologie per la traduzione,
più in generale, richiede un approccio
computazionale che deve essere, almeno in
parte, basato su dati linguistici, ed in particolare
su una descrizione linguistica esplicita
delle polirematiche, mediante l’uso di un dizionario
macchina ed un insieme di regole.
L'ipotesi è che un approccio linguistico può
integrare le metodologie statisticoprobabilistiche
per una corretta identificazione
e traduzione delle polirematiche, poiché risorse
linguistiche quali dizionari macchina e
grammatiche locali ottengono risultati accurati
per gli scopi del TAL. La metodologia
adottata per questa ricerca si basa su (i)
Nooj, un ambiente TAL che permette lo sviluppo
e la sperimentazione di risorse linguistiche,
(ii) un dizionario macchina Inglese-
Italiano di polirematiche, (iii) un insieme di
grammatiche locali. Il dizionario è costituito
principalmente da verbi frasali, verbi supporto,
espressioni idiomatiche e collocazioni inglesi
e contiene diversi tipi di modelli di polirematiche
nonché la loro traduzione in lingua
italiana.The translation of Multiword Expressions
(MWEs) requires the knowledge of
the correct equivalent in the target language
which is hardly ever the result of a literal
translation. This paper is based on the assumption
that the proper treatment of MWEs
in Natural Language Processing (NLP) applications
and in particular in Machine Translation
and Translation technologies calls for a
computational approach which must be, at
least partially, knowledge-based, and in particular
should be grounded on an explicit linguistic
description of MWEs, both using an
electronic dictionary and a set of rules. The
hypothesis is that a linguistic approach can
complement probabilistic methodologies to
help identify and translate MWEs correctly
since hand-crafted and linguisticallymotivated
resources, in the form of electronic
dictionaries and local grammars, obtain accurate
and reliable results for NLP purposes.
The methodology adopted for this research work is based on (i) Nooj, an NLP environment
which allows the development and testing
of the linguistic resources, (ii) an electronic
English-Italian MWE dictionary, (iii) a set
of local grammars. The dictionary mainly
consists of English phrasal verbs, support verb
constructions, idiomatic expressions and collocations
together with their translation in Italian
and contains different types of MWE POS
pattern