Search CORE

45 research outputs found

Statisztikai gépi fordítási módszereken alapuló egynyelvű szövegelemző rendszer és szótövesítő

Author: Laki László János
Publication venue
Publication date: 01/01/2011
Field of study

Jelen munkában az SMT módszer alkalmazhatóságát vizsgáltam szófaji egyértelműsítő és szótövesítő feladat megoldására. Létrehoztam egy alaprendszert, illetve további lehetőségeket próbáltam ki a rendszer eredményeinek javítására. Megvizsgáltam, milyen hatást gyakorol a célnyelvi szótár méretének változtatása a rendszer minőségére, továbbá megoldást kerestem a tanító halmazban nem szereplő szavak elemzésének megoldására

University of Szeged

Témaspecifikus gépi fordítórendszer minőségének javítása domain adaptáció segítségével

Author: Laki László János
Publication venue
Publication date: 01/01/2019
Field of study

A mély tanulásos módszerek elterjedése napjainkban nagymértékben megváltoztatta a gépi fordítások emberi megítélését. A statisztikai gépi fordítórendszerekkel (SMT) szemben a neurálishálózat-alapon működő architektúrák (NMT) sokkal olvashatóbb fordításokat generálnak, melyek a hivatásos fordítók számára könnyebben és hatékonyabban javíthatók az utófeldolgozás során. Az új módszer nehézsége azonban, hogy a stabilan jó fodítási minőséget adó rendszerek tanításához nagy méretű tanítóanyagra van szükség. Ez azonban a legtöbb fordítócég vagy nyelvpár esetén nem áll rendelkezésre. Munkám során a kicsi és jó minőségű in-domain tanítóanyagokat adatszelekció segítségével feldúsítottam egy nagy méretű out-of-domain korpusz leginkább hasonló szegmenseivel. Az így létrehozott architektúrával sikerült statisztikailag szignifikáns mértékben javítanom a fordítórendszer minőségét az összes vizsgált esetben. Kutatásom során igyekeztem megtalálni a feladathoz leginkább alkalmas szelekciós módszert, illetve megvizsgáltam a rendszer működését több különböző nyelv- és domainpár kombinációval

University of Szeged

Statisztikai gépi fordítás módszerének alkalmazása egy- és többnyelvű nyelvtechnológiai problémák hatékony megoldására

Author: Laki László János
Publication venue
Publication date: 01/01/2015
Field of study

REAL-PhD

Mesterséges intelligencia a gépi fordításban

Author: Laki László János
Publication venue: Gondolat Kiadó
Publication date: 01/01/2018
Field of study

Repository of the Academy's Library

Mozaik nyelvmodell az AnaGramma elemzőhöz

Author: Indig Balázs
Laki László János
Prószéky Gábor
Publication venue: Szegedi Tudományegyetem
Publication date: 01/01/2016
Field of study

Repository of the Academy's Library

Morfológiai egyértelműsítés nyelvfüggetlen annotáló módszerek kombinálásával

Author: Laki László János
Orosz György
Publication venue
Publication date: 01/01/2013
Field of study

University of Szeged

Statisztikai és hibrid módszerek párhuzamos korpuszok feldolgozására

Author: Laki László János
Prószéky Gábor
Publication venue
Publication date: 01/01/2010
Field of study

Eladásunkban foglalkozunk a statisztikai gépi fordítás minségének javításával, az egyre mélyebb hibridizáció alkalmazásával, majd az angol– magyar kísérletek mellett olyan, morfológiailag közelebb álló nyelvpárok bevonásával, mint a lovári cigány nyelv és a magyar. Az eladás második felében egy tisztán statisztikai alapon mköd szövegannotáló rendszer létrehozásával és kiértékelésével foglalkozunk

University of Szeged

HuLaPos2 : fordítsunk morfológiát

Author: Laki László János
Orosz György
Publication venue
Publication date: 01/01/2014
Field of study

University of Szeged

Neural machine translation for Hungarian

Author: Laki László János
Yang Zijian Győző
Publication venue: 'Akademiai Kiado Zrt.'
Publication date: 01/01/2022
Field of study

Repository of the Academy's Library

Minőségbecslő rendszer egynyelvű természetes nyelvi elemzőhöz

Author: Laki László János
Yang Zijian Győző
Publication venue
Publication date: 01/01/2017
Field of study

A pszicholingvisztikai indíttatású természetes nyelvi elemzés egy új, emberi nyelvelemzést modellező nyelvtechnológiai módszer. Ez a modell egy valós idejű elemző, amelynek párhuzamosan több szála elemzi egyszerre a bemeneten sorban érkező szavakat, kifejezéseket vagy mondatokat. A párhuzamosan futó szálak közül az egyik a minőségbecslő modul, amely menedzseli, szűri a hibás és zajos bemenetet, valamint tájékoztatja a többi szálat a bemenet aktuális minőségéről. A minőségbecslő modul felépítéséhez a gépi fordítás kiértékeléséhez használt minőségbecslés módszerét használtuk. Ahhoz, hogy a minőségbecslő modellünk a természetes nyelvi elemző egyik párhuzamosan futó szálát képezze, ötvöztük az eredeti minőségbecslő rendszert a feladatorientált architektúrával. A kutatásunk során felépítettünk egy feladatorientált minőségbecslő rendszert, amely az egynyelvű szöveg valós idejű minőségének becslésére alkalmas. Az általunk létrehozott rendszer segítségével ∼70%-os pontossággal tudjuk megbecsülni a bemeneti szöveg minőségét. A rendszer az AnaGramma magyar nyelvű elemzőhöz készült, de más nyelvekre is használható

University of Szeged