33 research outputs found

    KorKorpusz : kézzel annotált, többrétegű pilotkorpusz építése

    Get PDF
    A cikk egy többrétegű, kézzel annotált korpuszt ismertet, bemutatja annak elemzési rétegeit – különös tekintettel az anafora- és koreferenciaannotációra – és az építés fázisait, valamint felvillantja a felhasználási lehetőségeket. A korpusz szabadon elérhető és felhasználható, az építéshez használt eszközök és dokumentációik, valamint az annotálási útmutatók biztosításával pedig lehetőség nyílik annak további szövegekkel történő bővítésére

    Neural morphological generators for Hungarian

    Get PDF
    Here we present a set of morphological generators for Hungarian that generate surface forms from emMorph and Universal Dependencies (UD) morphological tags with high accuracy. We experimented with two approaches: first, neural machine translation models were trained based on the morphological analysis as the source format and the corresponding surface form as the target format. Second, we tackled the problem as a text generation task, where the morphological analysis is followed by the correct word form. The corpus we used is a normalised version of Webcorpus 2.0 (Nemeskey, 2020). Marian MT proved to produce the best results, thus we evaluated its output manually on NerKor (Simon and Vadász, 2021). Our analysis shows that the generator achieves a high accuracy of 96.27% in the case of emMorph and 94.94% in the case of UD. After manual evaluation, we counted a more concise accuracy, which is 99.43% (emMorph) and 98.69% (UD). This model may be used for several NLP tasks, such as anonymisation and terminology translation

    Konverterek magyar morfológiai címkekészletek között

    Get PDF
    A magyarra alkalmazott morfológiai annotációs sémák és címkekészletek sokszínűsége és eltérő dokumentáltsága ösztönzött minket abban a munkában, amelynek első lépéseit mutatja be ez a cikk. A munka két fő részből áll: egyrészt összegyűjtjük és közzétesszük a magyarra alkalmazott morfológiai annotációs sémákkal és címkekészletekkel kapcsolatos elérhető információkat, másrészt konvertereket írunk a címkekészletek között. Ebben a cikkben három konvertert ismertetünk

    Koreferenciafeloldás magyar szövegeken BERT-tel

    Get PDF
    A cikk egy kísérletet mutat be, amelyben összevonva használtunk két koreferenciakorpuszt a magyar BERT modell finomhangolásához, amivel magyar szövegeken lehet koreferenciafeloldást végezni. A cikk ismerteti a kísérletünk lépéseit a korpuszok előkészítésétől és felhasználásától a BERT modell finomhangolásán keresztül az eredmények kiértékeléséig. A koreferenciafeloldót szabadon hozzáférhetővé tettük

    A többnyelvű Európa újraformálása: A nyelvközpontú mesterséges intelligencia

    Get PDF
    (3. magyar ELRC workshop, online esemény, 2022. február 7.

    Digitálisbölcsészet-oktatás Magyarországon

    Get PDF

    A birtokos esete az ablakkal

    Get PDF
    corecore