Jönnek a nagyok! : BERT-Large, GPT-2 és GPT-3 nyelvmodellek magyar nyelvre

Dodé Réka; Ferenczi Gergő; Héja Enikő; Jelencsik-Mátyus Kinga; Kőrös Ádám; Laki László János; Ligeti-Nagy Noémi; Vadász Noémi; Váradi Tamás; Yang Zijian Győző

Jönnek a nagyok! : BERT-Large, GPT-2 és GPT-3 nyelvmodellek magyar nyelvre

Authors: Dodé Réka
Ferenczi Gergő
Héja Enikő
Jelencsik-Mátyus Kinga
Kőrös Ádám
Laki László János
Ligeti-Nagy Noémi
Vadász Noémi
Váradi Tamás
Yang Zijian Győző
Publication date: 1 January 2023
Publisher

Abstract

Az utóbbi években rendkívüli mértékben felgyorsult a Transformer alapú nyelvmodellek méretének a növekedése. A globális technológiai cégek nagyobbnál nagyobb modelleket tanítanak, amelyek óriási erőforrást és tanítóanyagot igényelnek. Ezekkel a kísérletekkel azt próbálják bebizonyítani, hogy megfelelően nagy méretű modellek, megfelelően sok tanítóanyaggal képesek önmagukban akár finomhangolás nélkül bármilyen nyelvtechnológiai feladatot megoldani. Ebbe a versenybe nem igazán lehetséges beszállni, de arra van lehetőség, hogy az árnyékukban elkezdjünk kísérleteket végezni a nagyobb méretű modellek irányában. Kutatásunkban különböző nagy méretű nyelvmodelleket tanítottunk magyar nyelvre. Betanítottunk egy 6,7 milliárd paraméteres GPT-3, valamint egy GPT-2 és egy BERT-Large modellt magyar nyelvre. A modelleket különböző finomhangolással teszteltük. A BERT-Large modellünk több feladatban is felülmúlta a huBERT modellt, és elsőként hoztunk létre egynyelvű magyar GPT-3 modellt, amelyekkel tudomásunk szerint elsőnek végeztünk prompt kísérleteket few-shot tanulással magyar nyelvre

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

University of Szeged

oai:acta.bibl.u-szeged.hu:7841...

Last time updated on 18/04/2023