Alkalmazott MI és audio/video feldolgozás

2024-2025 tavasz

Szoftver

Téma leírása

A terület keretein belül több téma közül is lehet választani:

 

1            Magyar leirat készítő mp3 állományokból

1.1        Kategória: szoftver alkalmazásfejlesztés

1.2        Téma leírása

Adott egy könyvtárban max. 100db, egyenként max.1 órás magyar nyelvű előadást tartalmazó mp3 formátumú hanganyag. A fejlesztendő alkalmazás ezekből az mp3-as állományokból a szöveges tartalom leiratát állítja elő UTF-8 formátumban, legalább 3 percenként időbélyeggel.

1.3        Téma feldolgozásához szükséges előismeretek

Az alkalmazás Python, vagy PHP alapokon készüljön, a megoldás során open source eszközök szabadon használhatók.

1.4        Terület bemutatása

A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. Az mp3 formátumban rögzített prédikációkban tartalom szerinti kereséshez van szükség a szövegek leiratának elkészítésére.

1.5        A hallgató feladata, hogy

fejlesszen egy olyan szabadon futtatható alkalmazást, melynek segítségével a lelkész.com rendszeren kívül a megadott mp3 állományokból előállítja azok UTF-8 TXT leiratát a szövegben legalább 3 percenként elhelyezett időbélyegekkel. Előny, ha az időbélyegek gondolati, vagy mondathatárokon vannak.

 

2            Tematikus LLM (nagy nyelvi modell) kereső fejlesztése

2.1        Kategória: szoftver alkalmazásfejlesztés

2.2        Téma leírása

A Drupal rendszerben rendelkezésre álló párezer írott prédikáció, melyek száma folyamatosan nő, elérheti az egymilliót is. A nagy nyelvi modell alapú szoftver használatával az a célunk, hogy a felhasználó „beszélgethessen” a rendszerrel, ami a tárolt szövegek alapján adjon válaszokat.

2.3        Téma feldolgozásához szükséges előismeretek

  • Gépi tanulási rendszerismeret
  • Az alkalmazás a Drupal keretrendszerbe integrálható módon, open source eszközökre építve készüljön.

2.4        Terület bemutatása

A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.

Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.

2.5        A hallgató feladata, hogy

  • Fejlessze ki azt a beépülő chat-bot alkalmazást, ami a bibliai igehelyekről és a lelkész.com portálon tárolt prédikációk tartalmáról a felhasználóval a ChatGPT-hez hasonlóan képes beszélgetni.
  • A rendszer tudja kezelni a felekezeteket, és lelkészeket, azaz tudjon a felhasználó olyan kérdéseket is feltenni, mint pl. „Mit tanítanak a baptisták a gyermek keresztségről?”, vagy „Spurgeon mit tanított az eleve elrendelésről?”
  • Tesztelje a rendszert a megadott beszélgetési témakörök szerint (igehely, vagy témakör)

 

3            Youtube – mp3 konverter fejlesztése

3.1        Kategória: szoftver alkalmazásfejlesztés

3.2        Téma leírása

A Drupal rendszerben készüét lelkész.com adatbázisában több ezer rekord szerepel youtube hivatkozással, melyek csak internet kapcsolattal játszhatók le, és ha a youtube csatorna megszűnik, akkor nem lesznek elérhetők. Annak érdekében, hogy az igemagyarázatok a lelkész.com által kínált offline mp3 lejátszással is hallgathatóak legyenek, és a youtube csatorna elérhetetlensége esetén is megmaradjanak, elő kell állítani a youtube hivatkozásokhoz tartozó mp3-as állományokat, és az adott rekordhoz rendelve fel kell tölteni a lelkész.com-ra.

3.3        Téma feldolgozásához szükséges előismeretek

  • PHP (Drupal) alapismeretek, vagy
  • Python ismeret

3.4        Terület bemutatása

A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok népszerűsítése, tartalom és bibliai hivatkozás alapján kereshetőség biztosítása.

3.5        A hallgató feladata, hogy

  • Döntsön arról, hogy a youtube-mp3 konverziót a Drupal rendszeren belül, vagy önálló alkalmazásként kívánja megvalósítani.
  • Ha a rendszeren belül készül el az mp3 konverter, akkor szűrje le a youtube hivatkozással rendelkező, de mp3 csatolmánnyal nem rendelkező rekordokat. Ha önálló Python alkalmazást fejleszt, akkor egy xls állományban megkapja azon rekordok listáját, amelyekhez a konverziót el kell végezni.
  • Fejlessze le azt az alkalmazást, ami a youtube hivatkozáshoz tartozó mp3-as állományt elkészíti olyan beállításokkal, ami a szöveg hallgatására alkalmas, és az mp3-as állományt a megfelelő helyre feltölti, a file nevet a megfelelő adatbázis mezőbe beírja.
  • Automatikus teszttel győződjön meg arról, hogy az elkészült mp3 állomány lejátszható, hossza a youtube tartalom hosszával egyezik.

 

4            Spotify – mp3 letöltő és konverter fejlesztése

4.1        Kategória: szoftver alkalmazásfejlesztés

4.2        Téma leírása

Az adott Spotify csatornák tulajdonosainak hozzájárulásával a Spotify for Artists vagy Spotify Backendjének használatával le kell tölteni az eredeti audiofájlokat, és a hozzá tartozó meta adatokat egy adott excel sablonba rendezni.

4.3        Téma feldolgozásához szükséges előismeretek

  • Python ismeret
  • Több csatorna tulajdonosi hozzáférését tudja kezelni egy paraméter állományból.
  • Ellenőrzi, hogy az excel nyilvántartásban mely állományok nem szerepelnek.
  • A megadott csatornákhoz a hiányzó tartalmakat Spotify csatornánként egy-egy könyvtárba letölti, új csatorna esetén a könyvtárat létrehozza.
  • Ellenőrzi a fájlformátumokat, és amennyiben nem mp3-as a letöltött állomány, úgy azt mp3-ba konvertálja.
  • A konverzió sikerességét automata tesztesettel ellenőrzi.
  • Kitölti a meta adatokat a megadott sablon szerint.

4.4        A hallgató feladata, Egy olyan Python alkalmazás elkészítése, mely


Külső partner: lelkesz.com

Maximális létszám: 2 fő