Helyalapú közösségi hálózat felhasználóinak aktivitásadatain végzett prediktív analitikai eljárások

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

Mára a Web 2.0 megkerülhetetlen tényezőivé váltak az ún. helyalapú közösségi hálózatok. Egy efféle szolgáltatáson keresztül felhasználók tízmilliói osztják meg ismerőseikkel pillanatnyi tartózkodási helyeiket. Ekképpen egy helyalapú közösségi hálózat eddig nem látott mennyiségű viselkedési, térbeli és kapcsolati adat szabad forrása lehet.

A diplomaterv azt tűzi ki célul, hogy az egyik legnépszerűbb helyalapú közösségi hálózat, a Foursquare adataira építve olyan prediktív modellt alakítson ki, amely képes becslést tenni arra, hogy egy földrajzi koordinátáival és kategória-leíróival adott helyszínen hány felhasználói bejelentkezés fog történni. Egy ilyen előrejelző modell képes az üzleti döntéshozatalt támogatni, amennyiben a döntéshozónak arról kell határoznia, hol nyisson üzletet ahhoz, hogy a jövőben minél több látogatóra számíthasson.

A dolgozatban az adatbányászat hagyományos lépésein keresztül jutunk el a megoldásig. Először megismerjük a releváns aktuális kutatási területeket. Számba vesszük az adatgyűjtés lehetséges módjait, majd az általunk megszerzett adathalmaz sajátosságait tárjuk fel, ami során érdekes és a modellezés szempontjából értékes megfigyeléseket teszünk az emberi viselkedésről. Az adatelőkészítés során a helyszínek jellemzőinek körét bővítjük az általunk bevezetett ún. környékleíró jellemzőkkel. Ezek a jellemzők a vizsgálandó helyszínt környező egyéb helyszínek olyan tulajdonságait ragadják meg, amelyek segítenek a prognózisban. Ezek után különböző tanuló algoritmusokkal előrejelző modelleket építünk, amelyeket kiértékelünk, többek között egy általunk definiált üzleti szemléletű mutató szerint.

Sikeres eredményeink arra mutatnak, hogy ha valamely helyszínnek felhasználói aktivitását kívánjuk előre jelezni, akkor az azt körülvevő helyszínek tulajdonságainak figyelembe vétele nagyban javít a becslés minőségén. Modellünk segítségével az esetek mintegy háromnegyed részében helyesen meg tudjuk jósolni, hogy két helyszín közül melyik lesz a jövőben látogatottabb.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.