Intelligens adatfeldolgozás és -elemzés modell alapú támogatása

OData támogatás
Konzulens:
Gönczy László
Méréstechnika és Információs Rendszerek Tanszék

Informatikai rendszerekből származó adatok elemzésének egyik fontos lépése az ún. feltáró adatelemzés, mely megalapozza a későbbi statisztikai jellegű vizsgálatokat. A feltáró adatelemzés során az adattisztítás és -elemzés eredményességének feltétele annak a szakterületnek az ismerete, amelyből a vizsgált adathalmaz származik, annak érdekében, hogy a megfigyelt jelenségeket helyesen értelmezzük, ill. hatékonyan tudjuk kezelni az adatokat. Ugyanakkor az adatelemző és az adott adatforrás terület szakértője különbözhet. Jogosan merül fel a kérdés, hogy hogyan tudjuk az adatelemző és a szakértő tudását egy helyen, együttesen alkalmazni, elősegítve ezzel az adattisztítás nehézkes műveletének egyszerűsítését, gyorsítását és magának az adatelemzésnek a sikerességét.

Magas szintű szakterületi modellezés egy lehetséges módja ontológiák használata, melyek egyben lehetővé teszik a modellek formális ellenőrzését is. Munkám során arra keresem a választ, hogy egy adott szakterülettel kapcsolatos tudást (pl. metrikák várható korrelációja, topológia kapcsolatok) ontológiában rögzítve és ezt a tudást összekötve a szakterületből származó adathalmazzal, hogyan lehetséges a fentebb említett adattisztítás egyszerűsítése és az adatelemzés során megállapított új tudás felvétele a már létező tudásbázisunkba, hogy ezzel is segítsük a későbbi vagy más által elvégzett elemzéseket az adott területről származó adatokon.

Dolgozatomban virtualizált infrastruktúrák és IP multimédia rendszerek valós mérési adatokon alapuló teljesítményelemzését viszem végig az elkészült eszközzel, amely a tudásbázis tárolására gráfalapú adatbázist, az adatok feldolgozására pedig R statisztikai környezetet használ. Megvizsgálom, hogy a tetszőleges adatforrásból, ill. adatbázis-technológiából származó adatokat hogyan tudom hatékonyan megtisztítani, előkészíteni az elemzésre adattisztítási és -elemzési minták alkalmazásával, és hogyan lehetséges új ismeret feltárása az elemzések során (pl. működési tartományok megállapítása).

Mindezek mellett a segédeszköz elkészítése során figyelembe veszem, hogy az tetszőleges más szakterület esetén is alkalmazható legyen, akár más adatelemző eszköz alkalmazásával is. Ezen kívül lehetőséget biztosít az elemzés során vizsgált rendszer (pl. virtualizált infrastruktúra) vagy a mérési módszerek változásának lekövetésére is. Végül bemutatok néhány gyakorlati példát arra, hogyan lehet a módszert alkalmazni más szakterületeken.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.