MI alapú nyelvi modellek és RAG architektúrák fejlesztése a lelkész.com portálhoz

2025-2026 ősz

Szoftver

Téma leírása

A terület keretein belül több téma közül is lehet választani:

1            Bibliai hivatkozás kereső fejlesztése

1.1        Kategória: szoftver alkalmazásfejlesztés

1.2        Téma leírása

Szövegekben előforduló bibliai hivatkozások azonosítása.

1.3        Téma feldolgozásához szükséges előismeretek

  • Bibliai hivatkozási rendszer ismerete
  • Az alkalmazás open source eszközökre építve készüljön.

1.4        Terület bemutatása

A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.

Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.

1.5        A hallgató feladata, hogy

  • Különböző korokból és forrásokból származó, adatbázisban rendelkezésre álló txt szövegekben keresse meg a bibliai hivatkozásokat. Pl. II. János 3:12; János második levelének harmadik részében így szól az ige.
    A szövegek származhatnak könyvekből, kézzel gépelt és scannelt kiadványokból, vagy hanganyagok jlzi vagy gépi leiratából, ezért a bibliai hivatkozások szöveges megjelenése is sokféle lehet. A tipikus szabályok rendelkezésre állnak, de ezek legyenek bővíthetők.
  • A megtalált bibliai hivatkozásokat értelmezve szúrja be a szövegbe modern írásmóddal. Pl: (1Móz 3,10-12)

2            Alapige, lekció azonosító fejlesztése

2.1        Kategória: szoftver alkalmazásfejlesztés

2.2        Téma leírása

Istentiszteleteken elhangzott prédikációk leiratában meg kell keresni a prédikáció alapigéjét (textus) és lekcióját. A keresés MI-ben megfogalmazható szabályai adottak, de bővíthetőnek kell lenniük.

2.3        Téma feldolgozásához szükséges előismeretek

  • Bibliai hivatkozási rendszer ismerete
  • Az alkalmazás open source eszközökre építve készüljön.

2.4        Terület bemutatása

A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.

Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.

2.5        A hallgató feladata, hogy

  • Az írott istentiszteletek szövegében már azonosított igehelyek közül ki kell keresni a legfontosabbakat. Tipikusan az igehirdetések elején liturgia szerinti kulcsszavakkal azonosítható a lekció, és az alapige (textus).
  • A megtalált bibliai hivatkozásokat külön adatbázis mezőkbe kell tenni.

3            Tematikus LLM (nagy nyelvi modell) kereső fejlesztése

3.1        Kategória: szoftver alkalmazásfejlesztés

3.2        Téma leírása

Adatbázisban rendelkezésre álló húszezer írott prédikáció, melyek száma folyamatosan nő, elérheti az egymilliót is. A nagy nyelvi modell alapú szoftver használatával az a célunk, hogy a felhasználó „beszélgethessen” a rendszerrel, ami a tárolt szövegek alapján adjon válaszokat.

3.3        Téma feldolgozásához szükséges előismeretek

  • Gépi tanulási rendszerismeret
  • Az alkalmazás open source eszközökre építve készüljön.

3.4        Terület bemutatása

A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.

Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.

3.5        A hallgató feladata, hogy

  • Fejlessze ki azt a beépülő chat-bot alkalmazást, ami a bibliai igehelyekről és a lelkész.com portálon tárolt prédikációk tartalmáról a felhasználóval a ChatGPT-hez hasonlóan képes beszélgetni.
  • A rendszer tudja kezelni a felekezeteket, és lelkészeket, azaz tudjon a felhasználó olyan kérdéseket is feltenni, mint pl. „Mit tanítanak a baptisták a gyermek keresztségről?”, vagy „Spurgeon mit tanított az eleve elrendelésről?”
  • Tesztelje a rendszert a megadott beszélgetési témakörök szerint (igehely, vagy témakör)

4            Tematikus LLM (nagy nyelvi modell) fordító szoftver fejlesztése

4.1        Kategória: szoftver alkalmazásfejlesztés

4.2        Téma leírása

Rendelkezésre áll több bibliamagyarázó könyv eredeti forrásnyelvű és fordított, lektorált célnyelvű szövege. Olyan AI fordító szoftverekre alapuló alkalmazást szeretnénk fejleszteni, ami a rendelkezésre álló betanító szövegek stílusát képes megtanulni és ennek megfelelően új szövegeket fordítani, a fordítás minőségét olvashatósági jellemzők alapján értékelni.

4.3        Téma feldolgozásához szükséges előismeretek

  • Gépi tanulási rendszerismeret
  • Az alkalmazás open source eszközökre építve készüljön.

4.4        Terület bemutatása

A lelkész.com portál Drupal alapokon készült, a célja magyar nyelvű bibliamagyarázatok tartalom-elemzésének támogatása nagy mintákon. A szövegek bibliai hivatkozásokra (könyv, fejezet, vers) hivatkoznak, részeikben tematizálhatók. A felhasználók idézeteket is jelölnek ki a szövegekből, amiket szabadon címkézhetnek, ezek a címkék is használhatók az annotálás során.

Az adatbázisban a bibliai hivatkozások jelölve vannak, a jelölések a Biblia megfelelő szövegrészére mutatnak, a Biblia szövege is rendelkezésre áll.

4.5        A hallgató feladata, hogy

  • Akár több fordító AI segítségével építsen olyan modellt, amiben a célnyelvű szövegek olvashatósági és tartalomhűség szempontjából értékelhetők mai olvasó célközönség számára.
  • Az AI fordítók használatával készítsen a nyers fordításokból tartalomhű és könnyen olvasható célnyelvi verziót. Tipikus nyelvek: magyar, angol, német, de a megoldásban a nyelvek legyenek paraméterezhetők.

 

 

A téma a lekesz.com által meghirdetett külsős téma, melyben rengeteg lehetőség van. A megadott témakírás tájékoztató jellegű, természetesen ezeket a technológiákat, eszközöket a téma keretein belül is meg lehet tanulni, nem elvárás ezek magas szintű ismerete.

Kölcsönös érdeklődés esetén a téma tovább vihető következő félévekre és akár gyakorlatként is végezhető később.

A témából TDK/IDK-n is lehet indulni, melyet az egyetemi konzulens és a külsős konzulens is támogat!


Külső partner: lelkesz.com

Maximális létszám: 4 fő