Magyar jelentés-egyértelműsített korpusz

Almási, Attila; Csirik, János; Hatvani, Csaba; Szarvas, György; Szauter, Dóra; Vincze, Veronika

Magyar jelentés-egyértelműsített korpusz

Authors: Attila Almási
János Csirik
Csaba Hatvani
György Szarvas
Dóra Szauter
Veronika Vincze
Publication date: 1 January 2007
Publisher

Abstract

Az első magyar WSD korpusz elkészítéséhez 39 olyan szóalakot választottunk ki, melyek jó mintapéldák a jelentés-egyértelműsítés feladatának vizsgálatára. A kiválasztásnál a kritériumok között szerepelt, hogy az adott szóalak legyen gyakori a magyar nyelvben (ennek mérésére a Magyar Nemzeti Szövegtár (MNSZ) [8] gyakorisági adatait használtuk), illetve, hogy legyen több, használatában gyakorinak tekinthető jelentése. A korpusz szövegeit is az MNSZ-ből, annak Heti Világgazdaság (HVG) számaiból összeállított részkorpuszából válogattuk. Így minden egyes példához rendelkezésre áll a vizsgálat szempontjából releváns kontextus (teljes HVG-cikk), illetve automatikus tokenizálás, szófaji kódolás, szótőre vonatkozó információ

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

University of Szeged

oai:acta.bibl.u-szeged.hu:5867...

Last time updated on 09/07/2019