Felderítő adatelemzés GPGPU támogatása

OData támogatás
Konzulens:
Kocsis Imre
Méréstechnika és Információs Rendszerek Tanszék

A felderítő adatelemzés során kiemelt szerepet kap az adatok grafikus reprezentálása, amely a leghatékonyabb eszközt jelenti számunkra az adatok vizuális „bejárásához” és a bennük rejlő összefüggések felderítéséhez, ezzel elősegítve a hipotézisek felállítását. Az adatvizualizáció lehet statikus, de a hipotézisek felállításának hatékonysága jellemzően nagyobb, ha a megjelenítés interaktív módon történik.

Kis adathalmazok esetében az adatvizualizáció nem jelent kihívást a legtöbb erre szolgáló eszköz számára, azonban Big Data vizualizációja már statikus esetben is számos kihívással jár, ugyanakkor kialakulóban van a nagy adathalmazok felderítő adatelemzésének egy kanonikus megközelítése, amely választ ad a megjelenítés kihívásaira, de interaktivitás terén hiányosságok tapasztalhatók.

A szakdolgozatban áttekintést adok arról, hogy a Big Data milyen kihívásokat állít az adatvizualizációval szemben és milyen irányelveket, módszereket követve lehet hatékonyan megjeleníteni nagy adathalmazokat. Ezt követően bemutatok két kifejezetten nagy adathalmazok vizualizációjára szolgáló eszközt (Bigvis, Datashader), majd kitérek ezek által a vizualizáció számításának GPGPU támogatási lehetőségére, amelyet a CUDA platformot felhasználva megvalósítok.

Ezt követően, kihasználva a GPU támogatást, a Datashaderre alapozva megvalósítom a kijelölés és csatolt kiválasztás („selection and linked highlighting”) interakciót. Legvégül pedig ismertetem a prototípusomat arra, hogy hogyan lehet a GPGPU támogatott vizualizáció számítását kiterjeszteni GPU klaszterre, ezáltal egyszerre megvalósítva a vizualizáció számításának horizontális és vertikális skálázását.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.