Web forgalom elemzése NoSQL adatbázisok segítségével

OData támogatás
Konzulens:
Imre Gábor
Automatizálási és Alkalmazott Informatikai Tanszék

A számítástechnika megjelenésével egyidejűleg merült fel az igény az adatok rendezett tárolásának megoldására, ugyanis a számítógépek alapvetően adatokkal tudnak dolgozni, legyenek azok bitek, számok, szövegek, vagy komplexebb adatstruktúrák, képek, egyéb állományok. Már a XX. században is több különböző, egymástól eltérő adatmodellt használó adatbázis-kezelő rendszert fejlesztettek ki, melyek az adott időszakban felmerülő adattárolási és adatkezelési problémákra nyújtottak megoldásokat.

Ma már azt mondhatjuk, hogy ezen megoldások közül a relációs adatbázis-kezelő rendszerek állták ki a legjobban az idő próbáját, melyek a 70-es évek elején jelentek meg, és váltak mind a mai napig egyeduralkodó technológiává a digitális adattárolás terén. Ez köszönhető többek között annak a matematikai alapokkal rendelkező, stabil és általános lekérdező nyelvnek, melyet ma SQL néven ismerünk.

Az informatika ugyanakkor egy gyorsan változó tudományág, ám az adattárolás terén ezek a gyors változások nem voltak megfigyelhetők az ezredforduló előtt. Ma már azonban fontos látni, hogy a körülmények gyors változása miatt nem minden esetben nyújtanak hatékony megoldást a régi jól bevált módszerek. Ezt felismerve jelentek meg a 2000-es évek elején a modernebb adatbázis-kezelő rendszerek, melyeket összefoglaló néven NoSQL adatbázisokként ismerhetünk.

A dolgozatomban a főbb NoSQL adatbázis-kezelő rendszereket ismertetem részletesen egy példa feladaton keresztül, melyben valós webes forgalom adatait tárolom el, és dolgozom fel a különböző NoSQL technológiák segítségével. A technológiák előnyeit és hátrányait teljesítménymérések segítségével hasonlítom össze ugyanazon feladat relációs adatbázis-kezelő rendszerrel történő megoldásával. Külön kitérek az egyes technológiák által használt adatmodellekre, illetve az elosztottság támogatottságának részleteire is. Fontos megjegyezni, hogy a dolgozatom központi témája az adattárolási eljárások megismerése és összehasonlítása, nem a webes forgalom elemzése, és elemzési módszerek kutatása, ez csupán adatforrásként szolgál a különböző NoSQL rendszerek megismeréséhez.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.