Deep reinforcement learning algoritmusok tesztelése játékokon

2018-2019 ősz

Szoftver

Téma leírása

Atari Breakout

A feladat motivációja: A megerősítéses tanulás a gépi tanulás azon ága, ahol egy ágens (robot, gépi játékos stb.) a vizsgált környezetben (pl.: számítógépes játék) való tevékenykedés során tanulja meg, hogy hogyan tud jól teljesíteni (pl. megnyerni a játékot). A jelenlegi sikerekből ízelítő: https://deepmind.com/blog/deep-reinforcement-learning/. Egy gyakorlatiasabb példa: https://deepmind.com/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-40/. Előbbi esetén Atari jétákokról van szó, míg utóbbinál energia fogyasztás csökkentéséről a Google adatközpontjaiban.

Feladat: Egyszerű játék környezetekben különböző (hallgató és általam választott) algoritmusok tesztje, azzal a céllal, hogy minél kevesebb idő alatt, minél kevesebb minta vételezés segítségével történjen a tanulás.

Cél: Legalább három algoritmus kipróbálása és alapos (pl. tanulási görbe alapján) összehasonlítása. Mindegyik algoritmust legalább két jellegre eltérő játékon tesztelni.

Learning outcome:

  • Megerősítéses tanulás technológiáinak megismerése
  • Deep learning technológiák (architektúrák, library-k)
  • Banchmarking eszközök megismerése (OpenAI gym)

Maximális létszám: 2 fő