Magyar és angol tagmondatok közötti szemantikai viszonyok feltérképezése

2016-2017 tavasz

Téma leírása

A szemantikai elemzés (semantic parsing) célja, hogy nyers szöveges adathoz automatikusan készíthessünk szemantikai reprezentációt, azaz modellezzük a szöveg jelentését. Ahhoz, hogy a gép egy összetett mondat egyes tagmondatai közötti jelentésviszonyokat is megérthesse, össze kell gyűjteni a köznyelvben leggyakrabban előforduló szintaktikai mintákat (pl. "X, mert Y", "X, pedig Y", stb.) és meg kell feleltetni az általuk kódolt szemantikai viszonyoknak (pl. CAUSE(Y, X)). A hallgató feladata, hogy szintaktikailag elemzett angol és/vagy magyar szövegeken szemantikai elemzőket futtasson, a kimenet automatikus feldolgozásával pedig elkülönítse a legfontosabb ilyen mintázatokat. A munka során a hallgató közelebbről megismerheti a Python programozási nyelvet, megszokhatja a linuxos környezetben való munkát és a git verziókövető használatát, elsajátíthatja a természetes nyelvi adatok feldolgozásának alapjait. A szemantikai reprezentációkkal kapcsolatos munka később szakdolgozat és TDK-dolgozat alapja is lehet. Külső konzulens: Kornai András, MTA SZTAKI

Maximális létszám: 2 fő