Tudásgráf (AMR)-átfedések feltárása nagynyelvmodellek (LLM) segítségével

2024-2025 tavasz

Nyelvtechnológia

Téma leírása

A projekt célja egy olyan rendszer megvalósítása, amely képes több forrásból származó tudásgráfok közötti átfedéseket automatikusan feltárni, nagynyelvmodellek (LLM) változatos prompting technikáinak alkalmazásával. A rendszer feladata, hogy a különböző szerkezetű gráfokban összehangolja a megfelelő entitásokat, azonosítsa a szinonim vagy szemantikai megfelelőket, valamint feltárja az összefüggő relációkat. A projekt során a hallgató megismerkedhet a LLM-alapú módszerek adaptálásával, illetve a tudásgráfok összehasonlításának kísérleti értékelésével is.

Feltételek

  • Magabiztos Python ismeretek
  • PyTorch (vagy más deep learning keretrendszer) alapszintű használata
  • Alapvető gépi tanulási és NLP-ismeretek (pl. tokenizálás, embeddingek)
  • Gyakorlati problémamegoldó készség
  • Angol nyelvű szakirodalom olvasásának képessége

Külső partner: HUN-REN SZTAKI

Maximális létszám: 1 fő