Szemantikai alapú szövegelemzés a 4lang rendszer használatával

2016-2017 tavasz

Téma leírása

A szemantikai elemzés (semantic parsing) célja, hogy nyers szöveges adathoz automatikusan készíthessünk szemantikai reprezentációt, azaz modellezzük a szöveg jelentését. A 4lang rendszer modelljét olyan hálózatok alkotják, melyek néhány száz fogalom és az azok között fennálló kapcsolatok segítségével képesek leírni egy szó, egy kifejezés, egy mondat, vagy egy egész szövegrész jelentését is. A hallgató feladata, hogy megismerje a szövegből szemantikus hálót építő text_to_4lang rendszert, és bekapcsolódjon abba a munkába, melynek során a szövegek szintaktikai elemzését is szemantikus modellekkel támogatjuk meg a nagyobb pontosság elérése érdekében. A munka során a hallgató közelebbről megismerheti a Python programozási nyelvet, megszokhatja a linuxos környezetben való munkát és a git verziókövető használatát, elsajátíthatja a természetes nyelvi adatok feldolgozásának alapjait. A szemantikai reprezentációkkal kapcsolatos munka később szakdolgozat és TDK-dolgozat alapja is lehet.

Maximális létszám: 5 fő