2 research outputs found
Természetesnyelv-feldolgozás a korrupciókutatásban: új adatforrások, új módszerek, új tartalmi kérdések
DisszertáciĂłmban elĹ‘ször bemutatom a termĂ©szetesnyelv-feldolgozás hátterĂ©t, szemlĂ©ltetem, hogy hogyan lesz a szövegbĹ‘l numerikus adatbázis. Ezt követĹ‘en az elmĂşlt 20 Ă©vben, a korrupciĂłkutatás kapcsán megjelent tanulmányokat vizsgálĂł scoping review eredmĂ©nyeit ismertetem. A review bemutatja, hogy a korrupciĂłkutatásban hogyan alkalmaznak kĂĽlönbözĹ‘ megközelĂtĂ©seket (kvalitatĂv, kvantitatĂv Ă©s automatizált szövegelemzĂ©st) az elemzĹ‘k. Felvillantja, hogy a kĂĽlönbözĹ‘ mĂłdszerek mennyiben eltĂ©rĹ‘ kutatási kĂ©rdĂ©sekre tudnak választ adni, valamint hogy milyen fehĂ©r foltok azonosĂthatĂłk az automatizált szöveganalitika felhasználása terĂ©n.
A disszertáciĂł második felĂ©ben kĂ©t empirikus kutatáson keresztĂĽl egy-egy pĂ©ldát hozok a termĂ©szetesnyelv-feldolgozás kĂ©t tĂpusának (nem felĂĽgyelt Ă©s felĂĽgyelt mĂłdszerek) alkalmazására. Az elsĹ‘ tanulmány a korrupciĂł hazai online mĂ©diareprezentáciĂłjának tematikus elemzĂ©sĂ©t mutatja be, dinamikus topikmodellezĂ©st alkalmazva. A korpuszt a K-Monitor cikkgyűjtemĂ©nye adja, ami korrupciĂłgyanĂşs ĂĽgyeket feldolgozĂł, online cikkeket tartalmaz. Az esettanulmány egyfelĹ‘l exploratĂv jellegű: a 2007–2018 közötti idĹ‘szakra vonatkozĂłan azonosĂtja a cikkek fĹ‘bb tĂ©máit Ă©s a tematikus változás dinamikáját. MásfelĹ‘l magyarázĂł jellegű: megmutatja, hogy a sajtĂłban közölt hĂrek fĂĽggenek a tulajdonosi szerkezettĹ‘l Ă©s a politikai Ă©rdekektĹ‘l. Az elemzĂ©sbĹ‘l kiderĂĽl, hogy a kĂĽlönbözĹ‘ ideolĂłgiai hátterű mĂ©diumok kĂĽlönbözĹ‘ mĂłdon keretezik a korrupciĂłt.
A második esettanulmány a korrupciĂłt a közforrásokhoz valĂł korlátozott hozzáfĂ©rĂ©skĂ©nt Ă©rtelmezi, ami a közbeszerzĂ©si pályázatok esetĂ©ben a verseny korlátozásakĂ©nt jelenik meg. A kutatás cĂ©lja a versenykorlátozás elĹ‘rejelzĂ©se a közbeszerzĂ©si pályázatok szöveges rĂ©szeinek felhasználásával. Kb. 120000 magyar közbeszerzĂ©si szerzĹ‘dĂ©st elemzĂĽnk a 2011 Ă©s 2020 közötti idĹ‘szakbĂłl. Az elemzĂ©s korábbi kutatások eredmĂ©nyeire Ă©pĂt, Ă©s azt a gĂ©pi tanulás mĂłdszereivel bĹ‘vĂt ki. A korábbi (replikált) modellek Ă©s az Ăşj, logisztikus regressziĂł Ă©s Random Forest modellek elĹ‘rejelzĂ©sei alapján megállapĂthatĂł, hogy az Ăşj modellek felĂĽlmĂşlják az alapmodelleket. A modell jĂłságának ellenĹ‘rzĂ©sĂ©nĂ©l nem áll meg az elemzĂ©s: vizsgálja azt is, hogy a kĂĽlönbözĹ‘ szĂłtöbbeseknek milyen hatása van a korrupciĂłs kockázatra.
Abban bĂzom, hogy disszertáciĂłm Ăşj kaput nyit a korrupciĂłkutatás mĂłdszertanában, Ă©s pĂ©ldát mutat a szöveg, mint adat korrupciĂłkutatásban valĂł felhasználására