Szótáralapú névelem-felismerés szóhatárainak javítása gépi tanulási módszerrel

Abstract

Cikkünkben angol biológiai és magyar nyelv névelemeket felismer rendszert mutatunk be. Megközelítésünk a szótáralapú és a gépi tanuló módszerek elnyeit ötvözi. A szótáralapú névelem-felismerk egy adott adatbázis alapján jelölik a szövegbeli elfordulásokat, így a névelemek elfordulásaihoz hozzárendelhetek azok egyedi azonosítói. Az illesztett névelemek határainak korrekcióját, valamint a hibásan illesztett kifejezések kiszrését a feltételes véletlen mezk módszerén alapuló statisztikai rendszerrel végeztük el. Módszerünk összehasonlítva más megközelítésekkel a magyar tulajdonnevek felismerésében közel azonos, a biológiai névelemek felismerésében pedig jobb eredményt ért el, mint a klasszikus névelem-felismer módszerek

    Similar works