    Bilingual Spoken Monologue Corpus for Simultaneous Machine Interpretation Research

    This paper describes a large-scale bilingual corpus of spoken monologues and their simultaneous interpretation, which has been constructed at CIAIR. The corpus has the following characteristics: (1) English and Japanese speeches are recorded in parallel, (2) the data contains monologue speeches such as lecture and self-introduction, and (3) the exact beginning and ending times are provided for each utterance. We have collected a total of about 70 hours of speech data and transcribed them into ASCII text files. The corpus will be made publicly available in the near future. This paper also provides an analysis of the professional interpreter’s speeches using the bilingual corpus. The following points have been investigated: (1) the interpreting unit of simultaneous interpretation, (2) the difference between the beginning time of the lecturer’s utterance and that of the interpreter’s utterance, and (3) the interpreter’s speaking speed. The characteristic features about the timing at which simultaneous interpreters start to speak is presented. The analysis will be available for the development of a simultaneous machine interpreting system. 1

    Corpora e interpretazione simultanea

    In questo volume è presentata una proposta di applicazione del corpus-based approach agli studi sull’interpretazione, con particolare riferimento alla modalità simultanea. A tal fine, sono discusse le principali questioni teorico-pratiche e metodologiche implicate nella creazione di corpora elettronici per lo studio e la didattica dell’interpretazione. Inoltre, sono illustrati due progetti di ricerca appartenenti ai Corpus-based Interpreting Studies (CIS) che hanno portato alla realizzazione di due corpora elettronici di interpretazione: EPIC (European Parliament Interpreting Corpus) e DIRSI-C (Directionality in Simultaneous Interpreting Corpus). Tali risorse linguistiche, la prima trilingue (italiano, inglese e spagnolo), la seconda bilingue (italiano e inglese), con i rispettivi archivi multimediali su cui si basano, offrono molteplici possibilità di indagine e attività didattiche, a conferma del grande potenziale di questo innovativo paradigma di ricerca, frutto dell’incontro interdisciplinare tra la linguistica dei corpora e gli studi sull’interpretazione

    Unmodified English loanwords in interpreting and translation from Italian into Spanish: an experimental study through the Anglintrad corpus.

    L’obiettivo del presente progetto di ricerca è quello di far luce sul tema della gestione dei prestiti integrali dall’inglese, tratto tipico dell’italiano parlato in contesti istituzionali, da parte di interpreti simultaneisti e traduttori nella direzionalità italiano>spagnolo. L’idea alla base del progetto, dunque, è quella di analizzare, attraverso uno studio di tipo osservazionale, quali strategie possono essere attivate in interpretazione simultanea e in traduzione per far fronte a un fenomeno potenzialmente insidioso quale l’anglicismo integrale. La finalità ultima è quella di poterne ricavare una serie di possibili ricadute didattiche applicabili attraverso uno strumento di libero accesso, la piattaforma Anglintrad, a disposizione di docenti e studenti di interpretazione e traduzione, così come di professionisti all’interno di un percorso di formazione continua. La fase preliminare alla creazione della piattaforma è stata lo sviluppo di un corpus intermodale, Anglintrad, composto da discorsi originali italiani pronunciati nell’ambito della seduta plenaria del Parlamento europeo, dei relativi testi interpretati in spagnolo e delle traduzioni dei resoconti per esteso delle stesse sedute. Il carattere intermodale di Anglintrad ha consentito un confronto diretto tra le strategie adottate dagli interpreti e dai traduttori a fronte dello stesso fenomeno potenzialmente problematico e ha portato alla definizione di una tassonomia di strategie specifiche per poterle classificare. L’analisi dettagliata di ogni fenomeno è stata integrata da apposite schede analitiche recanti informazioni relative all’uso e al grado di assimilazione di ciascun prestito in lingua italiana. La parte applicativa del progetto Anglintrad è costituita dal suo uso sia come strumento formativo che di consultazione. Il lavoro di ricerca si conclude con quattro originali proposte didattiche.This research project examined the way in which a typical feature of spoken institutional Italian, namely the use of unmodified English loanwords, was managed by simultaneous interpreters and translators in the Italian>Spanish language pair. The main idea underlying the project consisted in the application of an observational study analysing the strategies used both in simultaneous interpreting and in translation in order to cope with a potentially troublesome phenomenon like the presence of unmodified English loanwords. The aim was to extract some possible didactic implications for application through an open-access tool, the Anglintrad online platform, which is designed for trainers and students in interpreting and translation, but also for professionals within a life-long learning framework. The preliminary phase leading to the creation of the platform entailed the compilation of an intermodal corpus, Anglintrad, consisting of a group of original speeches delivered in Italian at the European Parliament plenary sitting, the related Spanish interpreted texts and the translations of the verbatim reports of proceedings. As an intermodal corpus, Anglintrad made possible direct comparisons of the various strategies adopted by interpreters and translators who all faced the same potentially problem-triggering phenomenon. This led to the definition of a taxonomy of specific strategies. The analysis of each phenomenon was then supplemented by a newly created lexical database with detailed information on the use of each loanword in Italian and on its degree of integration into this language. The project also produced a practical part, namely the application of the platform as a didactic tool and for consultation purposes, and concluded with the development of four original didactic proposals