Webes használtautó apróhírdetések adatbányászati elemzése

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

Webes használtautó apróhirdetések adatbányászati elemzése

Kristofcsik Tibor

Konzulens: Gáspár-Papanek Csaba

BME Távközlési és Médiainformatikai Tanszék

A használtautók piaca egy olyan terület, ahol sok adat állhat rendelkezésre: például egy online hirdetési rendszerben több tízezer eladó gépjármű adatait tárolják az egyes hirdetésekhez.

Napjainkban az informatikai tudományok egyre népszerűbb területe az adatbányászat. A legkülönbözőbb mérnöki, tudományos és üzleti területeken alkalmaznak adatbányászati módszereket a nagy mennyiségben rendelkezésre álló adatok hasznosítására, hogy korábban nem ismert összefüggéseket és új információkat nyerhessenek ki azokból.

Eme diplomamunka célja, hogy egy ilyen használtautók adatait tartalmazó adatbázisból kiindulva megvizsgáljam, hogyan lehet azt adatbányászati módszerekkel úgy feldolgozni, hogy egy ismeretlen árúnak tekintett, adott paraméterekkel megadott autó piaci értékét közelítőleg megbecsüljem.

Az adatbányászaton belül tipikus problémakör valamilyen érték előrejelzése bizonyos adatok alapján. Az ilyen - úgynevezett előrejelzési - feladatok megoldására használható algoritmusok egyike a lineáris regresszió, mely segítségével összefüggést kívánunk teremteni független paramétereink és az előrejelzendő paraméter közt. A vizsgálatokat erre a módszerre építve végzem el a CRISP-DM (Cross Industry Standard Process for Data Mining - ágazatok közti általános adatbányászati módszertan) módszertant követve.

A diplomamunkában leírtak nyomon követik a teljes adatbányászati folyamatot, kezdve az elérni kívánt célok részletezésével; az adatok megismerésének, kiválasztásának és tisztításának folyamatán át; a modellezési és tesztelési eljárások bemutatásán keresztül; az eredmények ismertetéséig.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.