1 research outputs found
Részben felügyelt tanulási módszerek a tulajdonnév felismerésben
Az általános gĂ©pi tanulás egyik paradigmája a rĂ©szben felĂĽgyelt tanulás az elmĂşlt Ă©vekben ismĂ©t elĹ‘tĂ©rbe kerĂĽlt. A mĂłdszer cĂ©lja a jelöletlen adatban rejlĹ‘ összefĂĽggĂ©sek kihasználásával javĂtani a pusztán jelölt adatokat használĂł tanulĂł algoritmusokon. Más szemszögbĹ‘l ezen technikák alkalmazásával kevesebb annotált adattal, Ăgy kevesebb emberi Ă©lĹ‘munka felhasználásával ugyanolyan (vagy közel ugyanolyan) pontosságĂş modellek Ă©pĂthetĹ‘ek, mint a nagyobb jelölt adatbázist használĂł modellekkel. A számĂtĂłgĂ©pes nyelvĂ©szet statisztikai megközelĂtĂ©seiben a megfelelĹ‘ mĂ©retű Ă©s minĹ‘sĂ©gű annotált tanĂtĂłkorpuszok meglĂ©te alapfeltĂ©tel. CikkĂĽnkkel arra szeretnĂ©nk felhĂvni a figyelmet, hogy a rĂ©szben felĂĽgyelt technikák alkalmazása mellett jelentĹ‘sen kisebb mĂ©retű korpuszok kĂ©zi annotálása is elĂ©gsĂ©ges. Ezt az állĂtást empĂrikusan is alátámasztjuk magyar Ă©s angol tulajdonnĂ©v-felismerĂ©si korpuszok felhasználásával