MI-bot fejlesztése rejtett szerepes játékokhoz (hidden role games, multi-agent games)

2024-2025 tavasz

Szoftver

Téma leírása

A mesterséges intelligencia (MI) napjaink egyik legdinamikusabban fejlődő területe, amely jelentős hatással van a tudományra, az iparra és a mindennapi életre. Az MI alkalmazása a multi-agent környezetekben különösen ígéretes, hiszen lehetőséget nyújt arra, hogy több autonóm ügynök együttműködjön, versengjen, vagy akár komplex döntéseket hozzon egy adott cél érdekében.

A mesterséges intelligencia multi-agent környezetekben való alkalmazása különösen jól demonstrálható a játékok világában, ahol több ügynök – legyenek azok emberek vagy gépi algoritmusok – dinamikusan kölcsönhatásba lép egymással. Olyan játékok, mint a sakk, a Go vagy a Dota 2, kiváló példák, amelyekben az MI forradalmasította a stratégiai döntéshozatalt és a tanulási folyamatokat.

A mesterséges intelligencia alkalmazása különösen érdekes lehet rejtett szerep (hidden rola) típusú játékokban. Ilyen ismert játék például a Mafia, Werewolf vagy a The Resistance: Avalon (magyarul gyilkosos, mafia, merlin stb. neveken futnak ezek). Ez különösen érdekes kihívásokat rejt magában, hiszen ezekben a játékokban a siker kulcsa nemcsak a stratégiai döntéshozatal, hanem a blöffölés, a manipuláció és a más játékosok szándékainak felismerése is. Az ilyen játékokban az ügynökök (játékosok) eltérő információkkal rendelkeznek, és rejtett célokat követnek, így az MI-nek nemcsak a közvetlen környezetet kell figyelembe vennie, hanem más játékosok viselkedését, döntéseit és kommunikációját is elemeznie kell.

A hallgató feladat egy bot kidolgozása a "The Resistance: Avalon" című játék egyszerűsített verziójához [1]. A játék egyszerűsített verziójában a lehetséges lépéseknek csak egy részhalmazát vesszük, amelyek elégségesek, ha gép számára értelmezhetőek (nem kell LLM). A játék állapottere már így is meghaladja a sakk lehetséges állapotterét. A későbbiek során LLM is integrálható lehet majd a rendszerhez.

A feladat a következő részfeladatokra osztható:

  1. Kontroller implementációja a játékmenethez illeszkedően, egy ai-gym kidolgozása
  2. Multi-ágens tanítás
  3. Kliens készítése a játékhoz (lehet konzolos és webes, preferáltan React is)
A téma könnyedén továbbvihető diplomaterv témaként is. TDK-dolgozat témának is ideális.
Ha érdekel a téma, a félévkezdés előtt mindenképp egyeztessünk róla.
 

[1] Serrino, J., Kleiman-Weiner, M., Parkes, D. C., & Tenenbaum, J. (2019). Finding friend and foe in multi-agent games. Advances in Neural Information Processing Systems32.

Feltételek

  • Erős matematikai háttér (kombinatorika, valószínűségszámítás)
  • Mesterséges intelligencia módszerek ismerete (reinforcement learning)
  • Mélytanulási módszerek alapszintű ismerete

Maximális létszám: 2 fő