Alkalmazott MI és audio/video feldolgozás
2024-2025 tavasz
Szoftver
Téma leírása
A terület keretein belül több téma közül is lehet választani:
1 Magyar leirat készítő mp3 állományokból
1.1 Kategória: szoftver alkalmazásfejlesztés
1.2 Téma leírása
Adott egy könyvtárban max. 100db, egyenként max.1 órás magyar nyelvű előadást tartalmazó mp3 formátumú hanganyag. A fejlesztendő alkalmazás ezekből az mp3-as állományokból a szöveges tartalom leiratát állítja elő UTF-8 formátumban, legalább 3 percenként időbélyeggel.
1.3 Téma feldolgozásához szükséges előismeretek
Az alkalmazás Python, vagy PHP alapokon készüljön, a megoldás során open source eszközök szabadon használhatók.
1.4 Terület bemutatása
A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. Az mp3 formátumban rögzített prédikációkban tartalom szerinti kereséshez van szükség a szövegek leiratának elkészítésére.
1.5 A hallgató feladata, hogy
fejlesszen egy olyan szabadon futtatható alkalmazást, melynek segítségével a lelkész.com rendszeren kívül a megadott mp3 állományokból előállítja azok UTF-8 TXT leiratát a szövegben legalább 3 percenként elhelyezett időbélyegekkel. Előny, ha az időbélyegek gondolati, vagy mondathatárokon vannak.
2 Tematikus LLM (nagy nyelvi modell) kereső fejlesztése
2.1 Kategória: szoftver alkalmazásfejlesztés
2.2 Téma leírása
A Drupal rendszerben rendelkezésre álló párezer írott prédikáció, melyek száma folyamatosan nő, elérheti az egymilliót is. A nagy nyelvi modell alapú szoftver használatával az a célunk, hogy a felhasználó „beszélgethessen” a rendszerrel, ami a tárolt szövegek alapján adjon válaszokat.
2.3 Téma feldolgozásához szükséges előismeretek
- Gépi tanulási rendszerismeret
- Az alkalmazás a Drupal keretrendszerbe integrálható módon, open source eszközökre építve készüljön.
2.4 Terület bemutatása
A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.
Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.
2.5 A hallgató feladata, hogy
- Fejlessze ki azt a beépülő chat-bot alkalmazást, ami a bibliai igehelyekről és a lelkész.com portálon tárolt prédikációk tartalmáról a felhasználóval a ChatGPT-hez hasonlóan képes beszélgetni.
- A rendszer tudja kezelni a felekezeteket, és lelkészeket, azaz tudjon a felhasználó olyan kérdéseket is feltenni, mint pl. „Mit tanítanak a baptisták a gyermek keresztségről?”, vagy „Spurgeon mit tanított az eleve elrendelésről?”
- Tesztelje a rendszert a megadott beszélgetési témakörök szerint (igehely, vagy témakör)
3 Youtube – mp3 konverter fejlesztése
3.1 Kategória: szoftver alkalmazásfejlesztés
3.2 Téma leírása
A Drupal rendszerben készüét lelkész.com adatbázisában több ezer rekord szerepel youtube hivatkozással, melyek csak internet kapcsolattal játszhatók le, és ha a youtube csatorna megszűnik, akkor nem lesznek elérhetők. Annak érdekében, hogy az igemagyarázatok a lelkész.com által kínált offline mp3 lejátszással is hallgathatóak legyenek, és a youtube csatorna elérhetetlensége esetén is megmaradjanak, elő kell állítani a youtube hivatkozásokhoz tartozó mp3-as állományokat, és az adott rekordhoz rendelve fel kell tölteni a lelkész.com-ra.
3.3 Téma feldolgozásához szükséges előismeretek
- PHP (Drupal) alapismeretek, vagy
- Python ismeret
3.4 Terület bemutatása
A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok népszerűsítése, tartalom és bibliai hivatkozás alapján kereshetőség biztosítása.
3.5 A hallgató feladata, hogy
- Döntsön arról, hogy a youtube-mp3 konverziót a Drupal rendszeren belül, vagy önálló alkalmazásként kívánja megvalósítani.
- Ha a rendszeren belül készül el az mp3 konverter, akkor szűrje le a youtube hivatkozással rendelkező, de mp3 csatolmánnyal nem rendelkező rekordokat. Ha önálló Python alkalmazást fejleszt, akkor egy xls állományban megkapja azon rekordok listáját, amelyekhez a konverziót el kell végezni.
- Fejlessze le azt az alkalmazást, ami a youtube hivatkozáshoz tartozó mp3-as állományt elkészíti olyan beállításokkal, ami a szöveg hallgatására alkalmas, és az mp3-as állományt a megfelelő helyre feltölti, a file nevet a megfelelő adatbázis mezőbe beírja.
- Automatikus teszttel győződjön meg arról, hogy az elkészült mp3 állomány lejátszható, hossza a youtube tartalom hosszával egyezik.
4 Spotify – mp3 letöltő és konverter fejlesztése
4.1 Kategória: szoftver alkalmazásfejlesztés
4.2 Téma leírása
Az adott Spotify csatornák tulajdonosainak hozzájárulásával a Spotify for Artists vagy Spotify Backendjének használatával le kell tölteni az eredeti audiofájlokat, és a hozzá tartozó meta adatokat egy adott excel sablonba rendezni.
4.3 Téma feldolgozásához szükséges előismeretek
- Python ismeret
- Több csatorna tulajdonosi hozzáférését tudja kezelni egy paraméter állományból.
- Ellenőrzi, hogy az excel nyilvántartásban mely állományok nem szerepelnek.
- A megadott csatornákhoz a hiányzó tartalmakat Spotify csatornánként egy-egy könyvtárba letölti, új csatorna esetén a könyvtárat létrehozza.
- Ellenőrzi a fájlformátumokat, és amennyiben nem mp3-as a letöltött állomány, úgy azt mp3-ba konvertálja.
- A konverzió sikerességét automata tesztesettel ellenőrzi.
- Kitölti a meta adatokat a megadott sablon szerint.
4.4 A hallgató feladata, Egy olyan Python alkalmazás elkészítése, mely
Külső partner: lelkesz.com
Maximális létszám:
2 fő