33 research outputs found
KorKorpusz : kĂ©zzel annotált, többrĂ©tegű pilotkorpusz Ă©pĂtĂ©se
A cikk egy többrĂ©tegű, kĂ©zzel annotált korpuszt ismertet, bemutatja annak elemzĂ©si rĂ©tegeit – kĂĽlönös tekintettel az anafora- Ă©s koreferenciaannotáciĂłra – Ă©s az Ă©pĂtĂ©s fázisait, valamint felvillantja a felhasználási lehetĹ‘sĂ©geket. A korpusz szabadon elĂ©rhetĹ‘ Ă©s felhasználhatĂł, az Ă©pĂtĂ©shez használt eszközök Ă©s dokumentáciĂłik, valamint az annotálási ĂştmutatĂłk biztosĂtásával pedig lehetĹ‘sĂ©g nyĂlik annak további szövegekkel törtĂ©nĹ‘ bĹ‘vĂtĂ©sĂ©re
Neural morphological generators for Hungarian
Here we present a set of morphological generators for Hungarian that generate surface forms from emMorph and Universal Dependencies (UD) morphological tags with high accuracy. We experimented with two approaches: first, neural machine translation models were trained based on the morphological analysis as the source format and the corresponding surface form as the target format. Second, we tackled the problem as a text generation task, where the morphological analysis is followed by the correct word form. The corpus we used is a normalised version of Webcorpus 2.0 (Nemeskey, 2020). Marian MT proved to produce the best results, thus we evaluated its output manually on NerKor (Simon and Vadász, 2021). Our analysis shows that the generator achieves a high accuracy of 96.27% in the case of emMorph and 94.94% in the case of UD. After manual evaluation, we counted a more concise accuracy, which is 99.43% (emMorph) and 98.69% (UD). This model may be used for several NLP tasks, such as anonymisation and terminology translation
Konverterek magyar morfolĂłgiai cĂmkekĂ©szletek között
A magyarra alkalmazott morfolĂłgiai annotáciĂłs sĂ©mák Ă©s cĂmkekĂ©szletek sokszĂnűsĂ©ge Ă©s eltĂ©rĹ‘ dokumentáltsága ösztönzött minket abban a munkában, amelynek elsĹ‘ lĂ©pĂ©seit mutatja be ez a cikk. A munka kĂ©t fĹ‘ rĂ©szbĹ‘l áll: egyrĂ©szt összegyűjtjĂĽk Ă©s közzĂ©tesszĂĽk a magyarra alkalmazott morfolĂłgiai annotáciĂłs sĂ©mákkal Ă©s cĂmkekĂ©szletekkel kapcsolatos elĂ©rhetĹ‘ informáciĂłkat, másrĂ©szt konvertereket Ărunk a cĂmkekĂ©szletek között. Ebben a cikkben három konvertert ismertetĂĽnk
Koreferenciafeloldás magyar szövegeken BERT-tel
A cikk egy kĂsĂ©rletet mutat be, amelyben összevonva használtunk kĂ©t koreferenciakorpuszt a magyar BERT modell finomhangolásához, amivel magyar szövegeken lehet koreferenciafeloldást vĂ©gezni. A cikk ismerteti a kĂsĂ©rletĂĽnk lĂ©pĂ©seit a korpuszok elĹ‘kĂ©szĂtĂ©sĂ©tĹ‘l Ă©s felhasználásátĂłl a BERT modell finomhangolásán keresztĂĽl az eredmĂ©nyek kiĂ©rtĂ©kelĂ©sĂ©ig. A koreferenciafeloldĂłt szabadon hozzáfĂ©rhetĹ‘vĂ© tettĂĽk
A többnyelvű Európa újraformálása: A nyelvközpontú mesterséges intelligencia
(3. magyar ELRC workshop, online esemény,
2022. február 7.