Inkrementális Mondrian anonimizálás

OData támogatás
Konzulens:
Dr. Dudás Ákos
Automatizálási és Alkalmazott Informatikai Tanszék

A technolóia fejlődésével egyre nagyobb szerepet kap a magánszemélyekről történő adatgyűjtés. A digitalizálódó társadalom következtében egyre több személyes adatunk elérhető az interneten: az egyszerű szoftveres telemetriáktól kezdve egészen az orvosi leletekig. Az adatgyűjtés természetessé válásával párhuzamosan a személyes adatok védelmével foglalkozó technológiák és szabályozások is egyre hangsúlyosabbá váltak. Semmi sem mutatja ezt jobban, mint az Európai Unió által 2018-ban életbe léptetett, a magánélet és személyes adatok védelmét célzó GDPR (General Data Protection Regulation) szabályozás. Az adagyűjtés és a személyéségi adatok védelme között fennáló ellentét egy lehetséges megoldása az adatok anonimizálása. Ez az út viszont nehezen járható egy olyan rendszer esetében, ahol az anonimizálandó adatok nem állnak előre rendelkezésre, hanem egy folyamatos adatfolyam keretében érkeznek. Ez a felhasználási terület több problémát is felvet, többek között az anonimizálás teljesítményével és minőségével kapcsolatban.

Dolgozatomban először bemutatom a jelenleg legelterjedtebb anonimizálási módszereket, majd a Mondrian algoritmust kiegészítem olyan módon, amely lehetővé teszi annak inkrementális futtatását. Megvizsgálom a módszer párhuzamosíthatóságainak lehetőségeit illetve mutatok egy megoldást az anonimizált adathalmazok perzisztens tárolására is. Az inkrementális az anonimizálás minősége szempontjából megközelíti a hagyományos megoldást és jelentősen jobb teljesítményt kínál folyamatosan beérkező adatok esetében.

Úgy gondolom, hogy a bemutatott algoritmus hasznos részét képezheti bármely olyan rendszernek, ahol folyamatos adatgyűjtésre van szükség de ettől függetlenül fontos a személyes adatok védelme.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.