3 research outputs found
Spontán, nagyszótáras, folyamatos beszéd gépi felismerési pontosságának növelése beszélőadaptációval a MALACH projektben
CikkĂĽnkben bemutatjuk, hogy az MLLR (Maximum Likelihood Linear Regression) alapĂş beszĂ©lĹ‘adaptálás során a beszĂ©dfelismerĂ©si hatĂ©konyság az adott spontán magyar nyelvű adatbázison jelentĹ‘sen növekszik. TöbbfĂ©le mĂłdszert kiprĂłbáltunk mind a felĂĽgyelt mind a felĂĽgyeletlen adaptálĂłdás esetĂ©n is. A globális megoldás mellett regressziĂłs osztályokon alapulĂł transzformáciĂłt is alkalmaztunk; felĂĽgyeletlen modellillesztĂ©s esetĂ©n a többszörös adaptálást is megvizsgáltuk. Továbbá folyamatos, nagyszĂłtáras Ă©s spontán automatikus beszĂ©dfelismerĹ‘vel kapott eredmĂ©nyekkel támasztjuk alá, hogy ha a szĂł alapĂş nyelvi modell helyett a magyar nyelvet pontosabban leĂrĂł morfĂ©ma alapĂş modellezĂ©st alkalmazzuk, akkor a beszĂ©lĹ‘adaptálás által okozott javulás mĂ©g szignifikánsabban jelentkezhet a felismerĂ©si hibaarányban
Statisztikai és szabály alapú morfológiai elemzők kombinációja beszédfelismerő alkalmazáshoz
A magyar nyelvű számĂtĂłgĂ©pes beszĂ©dfelismerĂ©snĂ©l cĂ©lszerűnek tűnik, hogy ne a szavakat, hanem a morfĂ©mákat vegyĂĽk alapegysĂ©gnek a nyelvi modell felĂ©pĂtĂ©sĂ©hez. Ehhez viszont szĂĽksĂ©ges, hogy a szavakat a morfĂ©máknak megfelelĹ‘ szegmentumokra bontsuk. A cikk egy Ăşj szegmentálási technikát ismertet, ami kĂ©t kĂĽlönbözĹ‘ morfolĂłgiai szegmentálĂł mĂłdszer egyesĂtĂ©sĂ©bĹ‘l szĂĽletett, Ă©s mindkĂ©t Ĺ‘sĂ©nĂ©l jobban alkalmazhatĂł számĂtĂłgĂ©pes beszĂ©dfelismerĂ©shez. Ennek a rendszernek az egyik pillĂ©re egy szabály alapĂş morfolĂłgiai elemzĹ‘, a hunmorph, a másik pedig egy statisztikai alapokra Ă©pĂĽlĹ‘ morfolĂłgiai szegmentálĂł, a morfessor. A kompozĂciĂł során igyekeztĂĽnk mindkĂ©t rendszer elĹ‘nyeit megtartani, hátrányos tulajdonságait orvosolni. Ez nagyrĂ©szt sikerĂĽlt is, leszámĂtva, hogy a morfessor által biztosĂtott nyelvfĂĽggetlensĂ©g a hunmorph bevonásával elveszett