Természetesnyelv-feldolgozás a korrupciókutatásban
2023. november 22. 15:00 - 16:00
ELTE TáTK Kari Tanácsterem (1117 Budapest, Pázmány Péter sétány 1/a, 0.100C)
2023. november 22. 15:00 - 16:00
ELTE TáTK Kari Tanácsterem (1117 Budapest, Pázmány Péter sétány 1/a, 0.100C)
Katona Eszter Rita az előadásban a természetesnyelv-feldolgozás (Natural Language Processing, NLP) alkalmazását mutatja be a korrupciókutatásban. Először a kvalitatív, kvantitatív és automatizált szövegelemzési módszerek által megválaszolható kutatási kérdéseket ismerteti, valamint meghatározza az automatizált szövegelemzés fejlesztendő területeit. Ezt követően két empirikus elemzés kerül a fókuszba.
Az első kutatás dinamikus topikmodellezést alkalmaz a magyar online médiában a korrupcióról szóló diskurzus elemzésére, feltárva a korrupció keretezésének különbségeit a különböző ideológiai hátterű médiumokban. 26.000 cikk alapján elemzi a 2007 és 2018 közötti időszakra jellemző korrupciós témák népszerűségének és tartalmának változását.
A második tanulmány adminisztratív adatokra összpontosít: magyar közbeszerzési szerződéseket elemez a 2011 és 2020 közötti időszakból. A kutatás bemutatja a látens (szöveges) tartalom jelentős szerepét a közbeszerzési verseny korlátozásának azonosításában és előrejelzésében NLP-technikák segítségével.
Katona Eszter Rita a Társadalomkutatások Módszertana Tanszék adjunktusa és az RC2S2 (Research Center for Computational Social Science) kutatócsoport, valamint a Government Transparency Institute kutatója. Eszter automatizált szöveganalitikai módszerekkel elemzi és adatvizualizációs eszközökkel mutatja meg a nagy, szöveges adatforrások látens struktúráját. Jelenleg elsősorban közpolitikai elemzéseket végez és dashboardokat fejleszt, illetve a Digital Lens projekt oszlopos tagja.
Az esemény a Magyar Tudományos Akadémia „Magyar Tudomány Ünnepe 2023” című országos és határon túli programsorozatának része.