Adatfolyamok korszerű web alapú vizualizációja

OData támogatás
Konzulens:
Dr. Heszberger Zalán Tamás
Távközlési és Médiainformatikai Tanszék

Napjaink megnövekedett adatforgalma rengeteg előnnyel jár, de annak feldolgozása is egyre több kihívást tartogat. A nagy számú emberi közösségek vagy gépi szenzorok által létrehozott adatfolyamok gyűjtése és felhasználhatóvá tétele napjaink szakembereinek egyik komoly feladata.

Diplomamunkám célja, hogy egy olyan webes alkalmazást fejlesszek, amely képes adatfolyamok fogadására, feldolgozására, elemzésére és megjelenítésére. Az adatfolyamok forrása egy tőzsdei adatokat szolgáltató portál (Alpha Vantage), illetve az egyik legnépszerűbb közösségi oldal (Twitter), melyek adatai között adatbányászati módszerekkel keresek összefüggést. Munkám során arra törekszem, hogy az elemzést megvalósító paraméterek rugalmasan konfigurálhatóak legyenek, azaz személyre szabható elemzéseket lehessen végezni a rendszerrel. A feldolgozott tőzsdei adatokból, illetve a historikus tweetek szavaiból származó (, az egyes kifejezések koefficienseit tartalmazó) kifejezés-súly lista meghatározása után a valós idejű tweetek előfordulásának megjelenítése történik.

Célom egy olyan megoldást létrehozni, melynek használatával a Twitteren előforduló szavak és kifejezések összefüggésbe hozhatók a tőzsde alakulásával. A rendszer képes interakcióba lépni a szerverekkel, a fogadott adatokat (a rugalmasan konfigurálható paraméterek mentén) strukturálni, és az adatfolyamot egy olyan data frame-mé alakítani, amelyre adatbányászati modellek illeszthetők. A Ridge és a Lasso regresszió használatával pedig olyan eredmény érhető el, amely ösztönzőleg hathat a további kutatásokra.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.