Privát szféra a zsebben: On-device RAG architektúra megvalósítása és mérése mobil környezetben
2025-2026 tavasz
Szoftver
Téma leírása
A projekt célja egy teljesen offline működő, Android alapú intelligens asszisztens létrehozása, amely a legújabb "Small Language Model" (SLM) technológiákat és eszközön futó vektoradatbázisokat ötvözi a maximális adatbiztonság érdekében.

Kontextus: A felhőalapú AI megoldások használata során a személyes adatok kikerülnek a felhasználó ellenőrzése alól, ami adatvédelmi kockázatot jelent. Emellett instabil internetkapcsolat esetén a szolgáltatás elérhetetlenné válik. A kihívást az jelenti, hogyan futtassunk erőforrás-igényes RAG (keresés és generálás) folyamatokat a telefon korlátozott hardverén.
A feladat részletes kifejtése: A hallgatónak a következő technikai kihívásokat kell megoldania:
-
Lokális Modell Integráció: Egy nyílt forráskódú, kisméretű modell (pl. Gemma 2B, Phi-3 vagy Llama-3-8B quantized verzió) futtatása Android környezetben (pl. MediaPipe LLM Inference vagy MLC LLM segítségével).
-
On-device Vektoradatbázis: A felhasználó dokumentumainak (pl. jegyzetek, letöltött cikkek) darabolása (chunking) és beágyazása (embedding) helyi erőforrásokkal, majd tárolása egy mobilra optimalizált vektoros tárolóban (pl. SQLite-vec).
-
RAG Pipeline: A keresési és válaszgenerálási folyamat összehangolása, biztosítva a memóriakezelés stabilitását.
-
Mérési keretrendszer: Modul fejlesztése, amely naplózza az energiafogyasztást, a memóriahasználatot, a Token/másodperc sebességet és a válaszidőt (latency) különböző hardveres beállítások mellett.
Végeredmény: Egy natív Android alkalmazás, amely internetkapcsolat nélkül képes kérdésekre válaszolni a telefonon tárolt saját dokumentumok alapján, valamint egy beépített diagnosztikai nézet, amely megjeleníti a teljesítményadatokat.
Javasolt technológiák:
-
Mobil: Android (Kotlin) natív fejlesztés.
-
AI Engine: MediaPipe, TensorFlow Lite vagy ONNX Runtime.
-
Adatbázis: SQLite (vektoros kiegészítéssel) vagy objektum doboz.
Szükséges saját eszköz: Modern, nagy teljesítményű Android okostelefon, minimum 8GB (de inkább 12GB+) RAM-mal a lokális modellek memóriatigénye miatt (pl. Google Pixel, Samsung S-széria, Xiaomi csúcsmodellek).
A téma TDK dolgozatra is alkalmas, valamint több féléves projekt laborként is továbbvihető.
Maximális létszám:
1 fő