MI alapú nyelvi modellek és RAG architektúrák fejlesztése a lelkész.com portálhoz
2025-2026 ősz
Szoftver
Téma leírása
A terület keretein belül több téma közül is lehet választani:
1 Bibliai hivatkozás kereső fejlesztése
1.1 Kategória: szoftver alkalmazásfejlesztés
1.2 Téma leírása
Szövegekben előforduló bibliai hivatkozások azonosítása.
1.3 Téma feldolgozásához szükséges előismeretek
- Bibliai hivatkozási rendszer ismerete
- Az alkalmazás open source eszközökre építve készüljön.
1.4 Terület bemutatása
A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.
Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.
1.5 A hallgató feladata, hogy
- Különböző korokból és forrásokból származó, adatbázisban rendelkezésre álló txt szövegekben keresse meg a bibliai hivatkozásokat. Pl. II. János 3:12; János második levelének harmadik részében így szól az ige.
A szövegek származhatnak könyvekből, kézzel gépelt és scannelt kiadványokból, vagy hanganyagok jlzi vagy gépi leiratából, ezért a bibliai hivatkozások szöveges megjelenése is sokféle lehet. A tipikus szabályok rendelkezésre állnak, de ezek legyenek bővíthetők.
- A megtalált bibliai hivatkozásokat értelmezve szúrja be a szövegbe modern írásmóddal. Pl: (1Móz 3,10-12)
2 Alapige, lekció azonosító fejlesztése
2.1 Kategória: szoftver alkalmazásfejlesztés
2.2 Téma leírása
Istentiszteleteken elhangzott prédikációk leiratában meg kell keresni a prédikáció alapigéjét (textus) és lekcióját. A keresés MI-ben megfogalmazható szabályai adottak, de bővíthetőnek kell lenniük.
2.3 Téma feldolgozásához szükséges előismeretek
- Bibliai hivatkozási rendszer ismerete
- Az alkalmazás open source eszközökre építve készüljön.
2.4 Terület bemutatása
A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.
Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.
2.5 A hallgató feladata, hogy
- Az írott istentiszteletek szövegében már azonosított igehelyek közül ki kell keresni a legfontosabbakat. Tipikusan az igehirdetések elején liturgia szerinti kulcsszavakkal azonosítható a lekció, és az alapige (textus).
- A megtalált bibliai hivatkozásokat külön adatbázis mezőkbe kell tenni.
3 Tematikus LLM (nagy nyelvi modell) kereső fejlesztése
3.1 Kategória: szoftver alkalmazásfejlesztés
3.2 Téma leírása
Adatbázisban rendelkezésre álló húszezer írott prédikáció, melyek száma folyamatosan nő, elérheti az egymilliót is. A nagy nyelvi modell alapú szoftver használatával az a célunk, hogy a felhasználó „beszélgethessen” a rendszerrel, ami a tárolt szövegek alapján adjon válaszokat.
3.3 Téma feldolgozásához szükséges előismeretek
- Gépi tanulási rendszerismeret
- Az alkalmazás open source eszközökre építve készüljön.
3.4 Terület bemutatása
A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.
Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.
3.5 A hallgató feladata, hogy
- Fejlessze ki azt a beépülő chat-bot alkalmazást, ami a bibliai igehelyekről és a lelkész.com portálon tárolt prédikációk tartalmáról a felhasználóval a ChatGPT-hez hasonlóan képes beszélgetni.
- A rendszer tudja kezelni a felekezeteket, és lelkészeket, azaz tudjon a felhasználó olyan kérdéseket is feltenni, mint pl. „Mit tanítanak a baptisták a gyermek keresztségről?”, vagy „Spurgeon mit tanított az eleve elrendelésről?”
- Tesztelje a rendszert a megadott beszélgetési témakörök szerint (igehely, vagy témakör)
4 Tematikus LLM (nagy nyelvi modell) fordító szoftver fejlesztése
4.1 Kategória: szoftver alkalmazásfejlesztés
4.2 Téma leírása
Rendelkezésre áll több bibliamagyarázó könyv eredeti forrásnyelvű és fordított, lektorált célnyelvű szövege. Olyan AI fordító szoftverekre alapuló alkalmazást szeretnénk fejleszteni, ami a rendelkezésre álló betanító szövegek stílusát képes megtanulni és ennek megfelelően új szövegeket fordítani, a fordítás minőségét olvashatósági jellemzők alapján értékelni.
4.3 Téma feldolgozásához szükséges előismeretek
- Gépi tanulási rendszerismeret
- Az alkalmazás open source eszközökre építve készüljön.
4.4 Terület bemutatása
A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.
Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.
4.5 A hallgató feladata, hogy
- Akár több fordító AI segítségével építsen olyan modellt, amiben a célnyelvű szövegek olvashatósági és tartalomhűség szempontjából értékelhetők mai olvasó célközönség számára.
- Az AI fordítók használatával készítsen a nyers fordításokból tartalomhű és könnyen olvasható célnyelvi verziót. Tipikus nyelvek: magyar, angol, német, de a megoldásban a nyelvek legyenek paraméterezhetők.
A téma a lekesz.com által meghirdetett külsős téma, melyben rengeteg lehetőség van. A megadott témakírás tájékoztató jellegű, természetesen ezeket a technológiákat, eszközöket a téma keretein belül is meg lehet tanulni, nem elvárás ezek magas szintű ismerete.
Kölcsönös érdeklődés esetén a téma tovább vihető következő félévekre és akár gyakorlatként is végezhető később.
A témából TDK/IDK-n is lehet indulni, melyet az egyetemi konzulens és a külsős konzulens is támogat!
Külső partner: lelkesz.com
Maximális létszám:
4 fő