Web privacy védelmi megoldások vizsgálata gépi tanulással

2020-2021 tavasz

Nincs megadva

Téma leírása

A web univerzális platform lévén lehetővé teszi, hogy amikor egy oldalra ellátogatunk, különféle forrásból származó kódok fussanak le számítógépünkön, telefonunkon. Ezek közül egyesek közvetlenül a látogató számára is hasznos részei lehetnek a weboldalnak, mint például a közösségi gombok vagy a csevegő blokkok (pl. Disqus), míg mások a weboldal üzemeltetőjének lehetnek hasznosak, mint például az analitikai vagy reklám célú beépülők.

A felhasználó szempontjából nézve azonban néhány third-party script kifejezetten kártékony lehet. Adatvédelmi vonatkozásból nézve ilyenek a nyomkövető típusú scriptek, amelyek a weboldalak megnyitásakor – a felhasználó tudta és beleegyezése nélkül – a háttérben futva mérik és figyelik a webes tartalomfogyasztási szokásainkat. Az így gyűjtött információkat használják fel a hirdetők személyre szabott reklámok elkészítéséhez, de ezek az információk alkalmasak az árak dinamikus manipulálására, vagy a keresési találatok befolyásolására.

A legalapvetőbb követési technika a böngésző sütik használata azonosítók tárolására. Azonban az elmúlt évtized felfutó technikája az ún. fingerprinting azonosító tárolása nélkül teszi lehetővé a látogató azonosítását. Ez a technika a böngésző adataiból állít össze egy egyedi azonosítót (Device ID), ami akkor is újra előállítható, ha a felhasználó törli a böngésző cache tárait és előzményeit. Egyes böngészők, mint a Firefox, Safari és Brave elkezdtek olyan funkciókat kínálni, amelyek a teljes web élmény mellett lehetővé teszik az ilyen megfigyelési módszerek kizárását. Azonban ezek az eljárások nem tökéletesek; kellő körültekintéssel meg lehet találni a gyenge pontjukat.

A hallgató feladata – a témakör megismerése mellett – anti-fingerprinting védelmet nyújtó böngészők működésének vizsgálata. Az egyik prominens anti-fingerprinting irányzat szerint zaj hozzáadásával kellően elfedhetők a valódi adatok. Azonban a zaj legtöbbször – a normál böngészők működését ismerve – kimérhető, és a maszkolási kísérlet lebuktatása mellett akár az eredeti értékek is helyreállíthatók lehetnek. A feladat ilyen sérülékenységek keresése, kimérése és proof-of-concept szinten a gyengeségek kihasználása, akár gépi tanulási eljárásokkal is.

További érdekességek, olvasnivalók, ismerkedés a témával:

Maximális létszám: 3 fő