Multidimenzionális gráfok elemzése

OData támogatás
Konzulens:
Szárnyas Gábor
Méréstechnika és Információs Rendszerek Tanszék

A modern, elosztott gráffeldolgozó rendszerek nagy adathalmazok gyors feldolgozására képesek és használatuk egyre terjed az internetes alkalmazásokban. Mivel a gráfanalízis viszonylag új tudományterület, kevés az összehasonlítás az egyes rendszerek között. Ha egy webáruházat üzemeltetünk, milyen platformot válasszunk a felhasználói viselkedés elemzésére? Nem tudjuk elég részletesen, hogy melyik gráffeldolgozó rendszer milyen teljesítményre képes, és hogy a használati paraméterektől függően mikor melyiket válasszuk. Ebben a dolgozatban bemutatom a gráffeldolgozás elméleti hátterét és összehasonlítom az Apache Flink és Apache Giraph gráffeldolgozó rendszerek teljesítményét. Leírom az általam készített Java alkalmazás egyes implementációs részleteit, amely 14 multidimenzionális metrikát valósít meg mindkét rendszerben, leméri azok futási idejét, majd összehasonlítja és elemzi őket. Az eredmények megmutatják, hogy a metrikákat nem elosztott környezetben, egy számítógépen és közepesen nagy (tízezres nagyságrendű), generált gráfokon futtatva az Apache Flink jobb teljesítményre képes.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.