8 research outputs found

    Fonetikus morfológiai elemző beszédfelismeréshez

    Get PDF
    Ebben a tanulmányban azt mutatjuk be, hogy hogyan alakítottunk ki a magyar nyelvre fonetikus morfológiai elemzőt. Noha szegény morfológiájú nyelvek (mint amilyen az angol) esetében jó eredményt adnak a szóalak ngramm nyelvmodellek, ragozó nyelvekhez olyan nyelvmodelleket érdemes kialakítani, amelyek a puszta szósorrend helyett a szavak szerkezetét, alaktanát is figyelembe veszik. Ezek hatékony működéséhez azonban az szükséges, hogy bemenetük ne csupán a szóalak legyen, hanem az ahhoz tartozó morfológiai elemzés is. Ennek egyik módja az, ha fonematizáljuk a betűalapú morfológiai elemzőnket. Ennek alkalmazásával elkerülhető számos, a kiejtésszótár haszálatakor felmerülő buktató is

    Végesállapotú transzducerek mindenkinek

    Get PDF
    Cikkünkben bemutatunk két véges állapotú fordítóval működő nyílt és szabad szövegfeldolgozó komponenst, a huntokent flexibilitásban meghaladó tokenizálót és a hunmorph csomag jelenlegi elemző programjánál az ocamorph-nál nagyságrenddel gyorsabban futó morfológiai elemzőt. Mindkét szoftverre jellemző, hogy nagy korpuszok gyors feldolgozására készült és nem csak parancssorból lehet őket használni, hanem fejlesztői könyvtárként bármilyen alkalmazásba könnyen beilleszthetőek
    corecore