Valósidejű sérültlista Twitter alapokon

OData támogatás
Konzulens:
Dr. Biczók Gergely
Hálózati Rendszerek és Szolgáltatások Tanszék

A szakdolgozat keretében egy olyan több szoftverkomponensből álló, Python nyelven alapuló alkalmazást hoztam létre, melynek segítségével az egyik legnépszerűbb közösségi oldal, a Twitter mikroblog bejegyzéseit felhasználva készítek egy valós időben frissülő listát az angol első osztályú futball bajnokság, azaz a Premier League sérültjeiről. Ehhez először hasonló, Twitter alapú adatbányászattal és természetes nyelvi adatok feldolgozásával foglalkozó kutatásokat vizsgáltam, majd megismerkedtem a Python nyelvvel és a Twitter szolgáltatásaival.

A feladatnak megfelelően a közösségi oldal Streaming API-ján keresztül letöltöttem és szűrtem a bejegyzéseket, a letöltött tweeteket adatbázisban tároltam. A bejegyzések, csapatok, játékosok, sérülések és sérültek nyilvántartására MySQL relációs adatbázis-kezelő rendszert használtam. A bejegyzéseket természetes nyelvi adatok feldolgozási módszereivel vizsgáltam először offline, majd valós időben. Az eredményeket egy HTML alapú táblázatba mentettem, és összevetettem egy sérült játékosokkal foglalkozó nyilvántartással.

Az alkalmazás segítségével olyan információkat kaphatunk meg manuális beavatkozás nélkül, melyek a hivatalos híreknél is gyorsabban elérhetőek, kihasználva a közösségi oldalak által nyújtott lehetőségeket. Ez előnyt jelenthet például esélylatolgatásnál, sportfogadásnál, de az alkalmazott módszerek felhasználhatóak ettől eltérő témákban is.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.