Anonimizálás folyamatosan érkező adatokban

OData támogatás
Konzulens:
Dr. Dudás Ákos
Automatizálási és Alkalmazott Informatikai Tanszék

A mai világban kiemelkedő fontosságú az ügyfelek személyes adatainak védelme, amit a kormányok jogszabályokban is rögzítenek, hogy csökkentsék az érzékeny adatokkal való visszaélés lehetőségét. A cégeknek viszont bizonyos esetekben ki kell szolgáltatniuk ezeket az adatokat harmadik személy részére, ezért el kell rejteniük minden olyan információt, amiből az ügyfeleik kilétére fény derülhetne. Ennek egyik módja az anonimizálás, ami átalakítja a kiadott adatokat úgy, hogy azok információtartalma ne vesszen el, mégse lehessen következtetni belőle arra, hogy kire vonatkozik az adott adat.

Az anonimizálást általában statikusan végzik, egy egész adatbázison futtatva az algoritmust. Azonban olyan rendszerekben, ahol folyamatosan keletkeznek az adatok, és ezeket akarják adatbányászati célokra felhasználni, szükség lehet olyan algoritmusra, amely képes az adatfolyamban átadott adatok azonnali anonimizációjára.

A dolgozatomban ki fogok térni az anonimizálás elméleti alapjaira, ezen belül részletesebben bemutatom a k-anonimitás algoritmusát. Majd ezen ismeretek segítségével egy saját modellt készítek a folyamatosan érkező adatok feldolgozásához, amelyen egy saját módszert dolgozik ki az anonimizálás elvégzésére. Az eredmények vizsgálatához el fogom készíteni az algoritmus implementációját, és mérésekkel támasztom alá a módszer helyességét.

Célom egy olyan módszer kidolgozása, ami minél kisebb számításigénnyel dolgozik, hisz ez kiemelkedően fontos a real-time rendszerekben, viszont minél kisebb mértékben torzítsa a kimeneten létrejövő adattartalmat.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.