Anonimizálás nagy adathalmazokon

2018-2019 ősz

Szoftver

Téma leírása

Felhasználói és ügyfél adatok személyiségi jogok tekintetében érzékeny adatok. A Facebook - Cambridge Analytica botrány kapcsán kapcsán világossá vált, hogy a személyiségi jogokat igenis komolyan kell venni. Erre az életbe lépett GDPR szabályozás is rávilágít, súlyos büntetéssel súlytva a megsértést. Az anonimizálás lényege, hogy ha adatokat adunk át harmadik félnek, szabályozni tudjuk, mit láthat, és mit rejtünk el előle.

Az anonimizálás kellően biztonságos kell legyen, azaz ne legyen visszafejthető, viszont egy anonimizált rekord az erdeti helyen visszakereshető kell legyen. Például egy webshop a forgalmi adatait harmadik félnek üzleti elemzések céljából átadhatja, ha az adatokat anonimizálja. Az elemzés eredménye alapján a harmadik fél például javaslatot lehet, mely ügyfeleket keressük meg közvetlen ajánlatokkal. Ezt a javaslatot az anonimizált rekord alapján teheti meg. Ilyenkor az eredeti ügyfél visszkereshető kell legyen, de csak az adat gazdája által.

A probléma kifejezetten fontos big data környezetben, ahol nem csak a nagy adatmennyiség miatt van szükség hatékony algoritmusokra, de az is kihívást jelent, hogyan lehet kezelni a folyamatosan érkező adatokat (vagyis, hogyan érdemes anonimizálni, ha a teljes adathalmaz soha nem érhető el, mindig csak részletek érkeznek belőle).

A feladat a problémakör megismerése, iparban használt megoldások áttekintése, és egy készülőfélben levő szoftver (https://github.com/akosdudas/anonimization) továbbfejlesztése. A fejlesztés során modern technológiákat használunk (Docker, MongoDB, Go, Python, automatizált tesztek). A fejlesztésbe bekapcsolódva ezen technológiák megismerésére is lehetőség van.


téma továbbvihető szakdolgozatnak/diplomatémának. Feladatválasztástól függően a téma alkalmas lehet komolyabb, több féléves munkához, és akár TDK dolgozatot is lehet írni a témából. (Ez nem elrettentés, csak lehetőség, ha érdekel.)

A sikeres önálló labor, szakdolgozat, diplomaterv félévhez szükséges a hallgató és a konzulens együttműködése. Az elvárásokról és az elvégzett munka értékeléséről a https://www.aut.bme.hu/Course/VIAUAL01 tárgyi oldalon található dokumentumok az irányadóak, érdemes áttanulmányozni a jelentkezés előtt.

Maximális létszám: 3 fő