Anonimizálás Big Data környezetben

OData támogatás
Konzulens:
Dr. Dudás Ákos
Automatizálási és Alkalmazott Informatikai Tanszék

A közelmúltban a naponta keletkező új adatok mennyisége nagymértékben növekedésnek indult és e nagyméretű adathalmazok hatékony tárolására és kezelésére alakult ki a Big Data-nak nevezett tudomány terület. Az internet világában gyakorlatilag minden mérhető és feljegyezhető. Ki, honnan és mikor látogatott el egy honlapra. Milyen online szolgáltatást vett igénybe. Hol tartózkodott a felhasználó az adott időpontban. Ezekre a kérdésekre az interneten megfigyelhetően hagyott adatokból könnyen választ találhatunk.

A nagyvállalatok azonban egyre nagyobb figyelmet fordítanak az ügyfeleik adatainak a védelmére, mivel ezek a személyiségi jogok tekintetében érzékeny adatok. Mégis szükség lehet ezen adatok harmadik fél számára való átadására, ekkor kerül a képbe az adatok anonimizálása. Ennek a folyamatnak a során az érzékeny ügyfél adatok kódolásra vagy eltávolításra kerülnek.

A dolgozatomban szeretném bemutatni, hogy milyen módszerek léteznek a nagyméretű adathalmazok hatékony és biztonságos anonimizálására. Megvizsgálom a kérdéskör elméleti és technológiai vonatkozásait. Majd ezen ismeretek felhasználásával saját módszert alakítok ki az anonimizálási feladat elvégzésére. Ennek során szem előtt kell tartanom, hogy az ezeken az adatokon végzett elemzés eredményét a forrás rendszerben fel kell tudnom használni, így az anonimizálás visszafordítható kell, hogy legyen a forrás rendszerben és csak ott.

Célom egy olyan módszer kidolgozása, ami független a technológiai megvalósítástól, így több platformon is megvalósítható a feladat jellegétől függően. Ennek szemléltetésére el fogom készíteni a saját anonimizáló eszközömet egy kiválasztott Big Data platformon.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.