8 research outputs found
Fonetikus morfológiai elemző beszédfelismeréshez
Ebben a tanulmányban azt mutatjuk be, hogy hogyan alakĂtottunk ki a magyar nyelvre fonetikus morfolĂłgiai elemzĹ‘t. Noha szegĂ©ny morfolĂłgiájĂş nyelvek (mint amilyen az angol) esetĂ©ben jĂł eredmĂ©nyt adnak a szĂłalak ngramm nyelvmodellek, ragozĂł nyelvekhez olyan nyelvmodelleket Ă©rdemes kialakĂtani, amelyek a puszta szĂłsorrend helyett a szavak szerkezetĂ©t, alaktanát is figyelembe veszik. Ezek hatĂ©kony működĂ©sĂ©hez azonban az szĂĽksĂ©ges, hogy bemenetĂĽk ne csupán a szĂłalak legyen, hanem az ahhoz tartozĂł morfolĂłgiai elemzĂ©s is. Ennek egyik mĂłdja az, ha fonematizáljuk a betűalapĂş morfolĂłgiai elemzĹ‘nket. Ennek alkalmazásával elkerĂĽlhetĹ‘ számos, a kiejtĂ©sszĂłtár haszálatakor felmerĂĽlĹ‘ buktatĂł is
Végesállapotú transzducerek mindenkinek
CikkĂĽnkben bemutatunk kĂ©t vĂ©ges állapotĂş fordĂtĂłval működĹ‘ nyĂlt Ă©s szabad szövegfeldolgozĂł komponenst, a huntokent flexibilitásban meghaladĂł tokenizálĂłt Ă©s a hunmorph csomag jelenlegi elemzĹ‘ programjánál az ocamorph-nál nagyságrenddel gyorsabban futĂł morfolĂłgiai elemzĹ‘t. MindkĂ©t szoftverre jellemzĹ‘, hogy nagy korpuszok gyors feldolgozására kĂ©szĂĽlt Ă©s nem csak parancssorbĂłl lehet Ĺ‘ket használni, hanem fejlesztĹ‘i könyvtárkĂ©nt bármilyen alkalmazásba könnyen beilleszthetĹ‘ek