Online csalásdetektálás bankkártya tranzakciókon

OData támogatás
Konzulens:
Dr. Szűcs Gábor
Távközlési és Médiainformatikai Tanszék

A pénzügyi intézmények folyamatos fenyegetettségnek vannak kitéve, világszerte emberek ezrei kísérelnek meg csalásokat velük szemben. Csalások felismerése és megelőzése terén a gépi tanuló algoritmusok alkalmazása teljesen új perspektívát nyit meg az informatikusok elött. Egy jó csalásdetektáló modul beillesztése a banki rendszer megfelelő részére számos fenyegetés ellen nyújthat védelmet, célom egy ilyen modul elkészítése volt.

A szakdolgozat keretei közt publikus banki adatokat felhasználva elkészítettem egy gépi tanuláson alapuló csalásdetektáló modult. A feladat megoldása során a CRISP-DM metodika alapján dolgoztam. A modul elkészítését a banki szektor megoldásainak vizsgálata, majd a rendelkezésre álló adathalmazok feltáró elemzése előzte meg. A megfelelő gépi tanuló modell ismeretében szimuláltam a banki tranzakciós hálózat viselkedését, hogy megbizonyosodjak a csalásdetektáló rendszerem helyességéről.

A megvizsgált modellek közül a GBC (Gradient Boosting Classifier) osztályozó bizonyult a legjobb választásnak. A megfelelő modell kiválasztása során először kiegyensúlyozatlan, majd újra mintavételezett adathalmazon tanítottam. A modellek jobban teljesítettek abban az esetben, ha a tanítás újra mintavételezett adathalmazokon történt, ezen belül is legjobb eredményt az alul-mintavételezéssel lehetett elérni. A csalásdetektáló modul elkészítését Python programnyelven valósítottam meg, a Spark Streaming rendszer implementálása pedig segített az adatok minél gyorsabb feldolgozásában, valamint a megfelelő skálázhatóság elérésében. A megoldásom során tehát a Data Science világában jelenleg népszerű és legújabb technológiákat alkalmaztam. Az elvégzett munka után a kiválasztott két adathalmazon 89%-os illetve 99%-os fedést sikerült elérni. Az eredmények alapján a csalások nagy része a modul alkalmazásával megelőzhető.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.