Globális összefüggések keresése és vizsgálata a kosárlabdában, az adatbányászat eszközeivel

OData támogatás
Konzulens:
Pasic Alija
Távközlési és Médiainformatikai Tanszék

Az internet és az ezen keresztül elérhető adatok robbanásszerű növekedése egy forradalom elejét jelzik, amely az életünk minden területére hatással lesz. A soha nem látott ütemű gyarapodás a statisztikák előrejelzései alapján 2020-ra olyan méreteket ölthet, hogy az adatok elérhetik a 44 zettabyte körüli mennyiséget, ami átváltva mintegy 44 trillió gigabyte-nak felel meg. Az adatbányászat térnyerése ennek fényében szintén szignifikáns lesz.

A sport terén napjainkban egyre nagyobb szerepet játszanak az adatokból kinyert előrejelzések. Felhasználásuk nagyon sokrétű, segítséget nyújtanak sok egyéb mellett például az egyéni teljesítmény vizsgálatakor, a csapat összeállításkor és a játékosok egészségügyi kockázatának minimalizálásakor. A kosárlabda események elemeit már régóta fejlett eszközökkel és nagy pontossággal rögzítik, a mérkőzések végeredményének előre meghatározása pedig a kezdetektől foglalkoztatta az emberek fantáziáját, így a választott feladatom egy jó alapokkal induló adatbányászati probléma.

Szakdolgozatom első részében vizsgálom az adatbányászat egészét, mint az információ kinyerés tudományát. A kutatás során részletesen áttekintem annak osztályozását a folyamat céljai alapján, valamint kitérek az ehhez legtöbbször használt elemeire. Ismertetem továbbá az adatbányászat lépéseit, az ezeket leíró fő szabványokat, a főbb felhasználási területeket, valamint a feladatom elvégzéséhez választott eszközöket. A feladatom végére megalkotásra kerül egy olyan modell, ami becslést ad a kosárlabda mérkőzések végeredményére. A szakdolgozat második felében leírásra kerül az ehhez szükséges elvégzett lépések sora az adatszerzéstől a végeredményig. Végül az eredmény pontosságát vizsgálom valós sportfogadási adatok felhasználásával.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.