Hunpars : mondattani elemző alkalmazás

Abstract

A Hunpars-projekt célja egy nyílt forráskódú elemző alkalmazás létrehozása, amely automatikusan végzi el bármilyen értelmezhető magyar mondat szintaktikai elemzését, konkrétan a mondatot alkotó szócsoportok és azok egymáshoz való viszonyának azonosítását. Az elemzőt egy többkomponens rendszer részeként képzeljük el: a fejlesztés alatt álló modul bemenete egy elő- zőleg tokenizált mondat, amelyben a szavak morfológiai jegyeikkel felcímkézve szerepelnek. A szintaktikai elemzés szabályalapú: elsősorban egy szintaktikai kategóriákra épülő frázis-struktúra nyelvtan és kiegészítésként különböző lexikális tárak felhasználásával valósul meg. Az alkalmazást irodalmi, jogi, tudományos-ismeretterjesztő és sajtószövegből származó, kvázi-véletlenszeren kiemelt mondatokon teszteltük. A tesztmondatok 72%-ára helyes elemzést kaptunk, további 11% elemzésének hibája szótári hiányosságra vezethető vissza

    Similar works