Mélytanulási modellek kihívásai kis adathalmazokkal

2024-2025 tavasz

Szoftver

Téma leírása

Az utóbbi években az algoritmus-intenzív problémamegoldást felváltotta az adat-intenzív. Ez azt jelenti, hogy a problémákat attól függően tudjuk megoldani, hogy rendelkezünk-e hozzá elegendően sok információval, hiszen a mélytanulási modellek teljesítménye jelentősen függ a rendelkezésre álló adatok mennyiségétől és minőségétől. Sok esetben azonban a szükséges adathalmazok gyűjtése költséges, időigényes vagy egyszerűen nem lehetséges. A téma célja annak feltárása, hogy milyen módszerekkel lehet hatékonyan kompenzálni az adathiányt. Vizsgáljuk az adat augmentáció, a transzfer tanulás, a szintetikus adatok generálása és más technikák alkalmazhatóságát, valamint azok hatását a modellek teljesítményére.

A feladat során megismerkedhetsz a tanszéken folyó más folyamatban lévő kutatással is. A téma jó lehetőséget nyújt arra is, hogy ha megtetszik ez a fajta munka, akkor akár később más kutatásba is becsatlakozhatsz. Arról, hogy miért érdemes kutatási projektben dolgozni, ITT tudsz bővebben olvasni.

Feltételek

  • Python

Maximális létszám: 2 fő