research article

Mikrokorpus błędów językowych we współczesnej polszczyźnie

Abstract

Artykuł omawia proces tworzenia pierwszego korpusu błędów we współczesnej polszczyźnie oraz jego możliwe zastosowania. Głównym celem korpusu było wykorzystywanie go do trenowania modeli językowych opartych na głębokich sieciach neuronowych. Podczas anotacji pojawiło się jednak kilka problemów, które mogą być interesujące dla lingwistów, zwłaszcza zajmujących się językoznawstwem normatywnym. Problemy z anotacją wskazują na niedostatecznie jasne pojęcie błędu i kategoryzację usterek językowych. Statystyki korpusu pokazują w przybliżeniu, jaki jest poziom znajomości normy językowej u wykształconych Polaków i jakie typy błędów przeważają w tekstach. Taka informacja może być wykorzystana przez osoby zajmujące się kształceniem językowym na poziomie szkoły i studiów polonistycznych

    Similar works