Orchestrált konténerek feletti BigData infrastruktúra biztosítása

OData támogatás
Konzulens:
Dr. Simon Csaba
Távközlési és Médiainformatikai Tanszék

Dolgozatomban elosztott rendszereken futtatott BigData elemzéseket támogató infrastrukturális megoldások teljesítményét vizsgáltam. A BigData elemzések célja olyan következtetések megállapítása, ami a felhasználót értékes információhoz, az üzleti életben előnyhöz juttatja. A dolgozatomban az általános célú, nagy teljesítményt biztosító Apache Spark BigData rendszerben futtatott elemzési alkalmazást használtam a rendszer jellemzésére. A cél eléréséhez szükséges infrastrukturális követelmények kielégítéséhez megvizsgáltam egy felhő alapú környezetet és egy “könnyűsúlyú” virtualizációs rendszert, különös tekintettel az orkesztrációs megoldásokra. Munkám során az elérhető megvalósítások közül kiválasztottam egy OpenStack számítási felhőre, illetve egy Docker konténer technológiára fejlesztett Apache Spark megoldást. Felépítettem egy teszthálózatot, mely képes mindkét technológia értékelésére. A megvalósítási szakaszt követően egy Pi értékét megközelítő és egy egyszerű érzelemelemzés applikációkkal teszteltem a kialakított környezeteket. Összehasonlítottam futási idő tekintetében az eredményeket és értékeltem az Apache Spark megvalósítási alternatíváit.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.