Tömegközlekedési adatok prediktív analízise

OData támogatás
Konzulens:
Kazi Sándor Antal
Távközlési és Médiainformatikai Tanszék

Az adatbányászat az elmúlt két évtized során vált a világ egyik kiemelt jelentőségű iparágává. Segítségével a felhalmozott adatokból nem csupán a hagyományos adatbáziskezelés során kinyerhető adatok, hanem rejtett minták is elérhetővé válnak. A dolgozat elkészítése során a BKK publikusan hozzáférhető adatain végeztem adatelemzést és két, alapvetően különböző buszjárat megállóba érkezési és távozási idejére kíséreltem meg prediktív analitikai modellt készíteni.

Az irodalomkutatás során olyan módszereket és technikákat kerestem melyek az idősorokon történő előrejelzésekben voltak segítségemre, hogy velük minél pontosabb modelleket tudjak készíteni.

A feladatot a CRISP-DM módszertan iteratív lépéseit követve oldottam meg, amely során a mérnöki döntéseimet dokumentáltam. Az adatelemzés során kiválasztottam a feladat szempontjából releváns attribútumokat és a GradientBoostingRegressor modellező osztály megfelelő paramétereinek felhasználásával elkészítettem négy modellt. A létrehozott négy modell teljesítményét értékeltem, illetve egy abszolút hibaszámító függvény segítéségével összevetem. Ezek után ajánlást adtam a feladat továbbvitelére és a modellek esetleges javítására.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.