Zene generálás deep learning algoritmusokkal

2023-2024 tavasz

Nincs megadva

Téma leírása

A közelmúltban áttörés történt a deep learning technikák segítségével a tartalom generálás területén. Ez társadalmi változásokhoz is vezet, mivel a gépi tanulás által generált tartalom bizonyos felhasználási esetekben helyettesítheti az ember által létrehozott tartalmat. A leghíresebb technika a természetes nyelv feldolgozás (NLP) területén található, és a GPT modellekhez kapcsolódik (pl. ChatGPT, GPT-J). Mindazonáltal a vizuális tartalomgenerálás kiemelkedő szöveg-képgenerálási technikákkal is rendelkezik (pl. https://arxiv.org/pdf/2301.00704.pdf).

A projekt célja a zene generáló algoritmusok vizsgálata. Azt vizsgáljuk, hogy az AI-algoritmusok helyettesíthetik-e az emberi művészeket. A konkrét kérdés az, hogy bizonyos zeneszerzők stílusát felválthatja-e az AI. A kérdés megválaszolásához zene generáló algoritmusokat tervezünk betanítani oly módon, hogy mímeljék egy bizonyos zeneszerző stílusát. A generált tartalmat ezután szakértők értékelik.

Egy cikk audio tartalom generáláshoz az alábbi linken található: https://arxiv.org/pdf/2011.06801.pdf

A hallgató az audió tartalom generálásával a következőképpen fog dolgozni:

  • Ismerje meg a jelenlegi zene generáló algoritmusokat
  • Remélhetőleg egy újszerű algoritmust hoz létre
  • Szerezzen be egy (vagy több) datasetet és tanítsa be a kiválasztott algoritmusokat
  • Audió tartalom létrehozása a kiválasztott algoritmusokkal

Maximális létszám: 10 fő