FinUgRevita : nyelvtechnológiai eszközök fejlesztése kisebbségi finnugor nyelvekre

Abstract

A jelenleg is futó nemzetközi FinUgRevita projekt (2013-2017) keretében olyan nyelvtechnológiai eszközöket fejlesztünk, melyek a kis finnugor népek közülük a manysik (vogulok) és udmurtok (votjákok) nyelvének digitális és online jelenlétét teszi lehetővé, és segíti az anyanyelvi beszélőket és a tanulni vágyókat a nyelvi kommunikáció különféle színterein. A kezdeti fázisban a két nyelv jelenkori leíró nyelvtanai alapján nyelvtani kivonatok készülnek, melyek a készülő online morfológiai elemző szabályrendszerét adják, míg az eddig megjelent nyomtatott szótárak szkennelésével, OCR-es elemzésével és manuális javítással az udmurt esetében 13000, míg a manysi esetében előreláthatólag 10-15000 szavas elektronikusan felhasználható szótár készül. A morfológiai elemző futtatásához és további nyelvtechnológiai eszközök fejlesztéséhez az interneten szabadon elérhető udmurt és manysi nyelvű tartalmakból nagy tokenszámú korpuszt építünk. A projekt célja, hogy a készülő eszközök online szabadon hozzáférhetőek legyenek az udmurt és manysi nyelvek beszélőinek és tanulóinak számára, és nem utolsó sorban kutatási célokra is alkalmazhatóak legyenek

    Similar works