research

Transkrypcja tekstów pisanych przez cudzoziemców na potrzeby korpusu uczniowskiego

Abstract

Studenci-cudzoziemcy używają polszczyzny w specyficzny sposób. SJPdCUŁ zgromadziło zasób tekstów pisanych, które mogą być umieszczone w korpusie językowym. Jego przygotowanie właśnie się zaczęło. Rękopisy cudzoziemców mają jednak pewną graficzną specyfikę, a niektóre błędy zapisu prowadzą do efektów humorystycznych. Trudności wynikają często z nieodróżniania specyficznie polskich liter „ą” i „ę”; mylenia polskiego „ł” z łacińskim „t” oraz brania polskiego „z” za „z”. Wszystkie te zjawiska powinny być dostępne dla badaczy używających korpusu.Foreign students studying in Poland use the Polish language in a specific way. The School of Polish for Foreigners at the University of Lodz has collected some written texts that can be used in a language corpus. The preparation of such a corpus has just started. Handwritings, however, have their visual characteristics. Texts written by foreign students include mistakes that lead to humoristic effects. Frequent difficulties come from unrecognized differences between specifically Polish letters “ą” and “ę”; between Polish letter “ł” and Latin “t” or Polish “z” pronounced as [zh] in contrast to “z” pronounced as [z]. All these visual effects should be available for researchers using the corpus

    Similar works