Stvaranje usporedivih govornih podataka za manjinske jezike: prvi rezultati iz korpusa Kontatti

Abstract

In this contribution, we will deal with the issue of building a spoken corpus of conversational data that can be easily compared across languages. We will present linguistic codes embedded in Trentino and South Tyrol, where multilingualism (de jure) is the rule. In this area of northern Italy, more than two languages and cultures coexist and are in contact with one another. Th e corpus includes the major languages Italian and German and minor languages and dialects belonging both to the Romance language group, such as Ladin and Trentino dialect varieties, and from the Germanic language group, such as Cimbrian and South Tyrolean dialects. We will discuss the methodology used to elicit spontaneous spoken data in minor languages and dialects, focusing on the Map Task (Anderson et al. 1991), which has been shown to be an effi cient technique for eliciting semi–spontaneous dialogues and providing a representative sample of pragmatic, textual and syntactic contexts that are at least partially expected, and thus comparable (Cerrato 2007: 9). Th is technique allows the speakers to focus on extra–linguistic context and on a problem–solving task, reducing both the observer’s paradox and the speakers’ monitoring of their linguistic production.U ovom su radu prikazani izazovi pri stvaranju usporedivoga korpusa govornog jezika. Predstavljeni su jezični kodovi iz Trentina i Južnog Tirola, gdje je višejezičnost (de jure) pravilo. Na ovom području sjeverne Italije koegzistira više od dva jezika i više od dvije kulture koje su međusobno u dodiru. Korpus uključuje glavne jezike, talijanski i njemački te manjinske jezike i dijalekte koji pripadaju romanskoj skupini, poput ladinskog i trentinskih dijalekata, kao i one iz njemačke skupine, poput cimbrijskog i južnotirolskih dijalekata. U radu se raspravlja o metodologiji koja se koristi za prikupljanje spontanih govornih podataka u manjinskim jezicima i dijalektima, usredotočujući se na zadatak karte (Anderson i sur. 1991). Zadatak karte pokazao se učinkovitom tehnikom za dobivanje djelomično spontanih dijaloga, ali i reprezentativnoga uzorka pragmatičkog, tekstnog i sintaktičkog konteksta, koji je barem djelomično očekivan, a shodno tome i usporediv (Cerrato 2007: 9). Ova tehnika omogućuje govornicima da se usredotoče na izvanjezični kontekst i na zadatak rješavanja problema, umanjujući time i promatrački paradoks i nadgledanje vlastite govorne produkcije u ispitanik

    Similar works