Egészségügyi adatok prediktív adatbányászati elemzése

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

A diplomamunkám során részt vettem a közelmúlt legnevesebb adatbányászati versenyén, a Heritage Health Prize-on, amely során páciensek jövőbeli kórházban tartózkodását kellett prediktálni minél nagyobb pontossággal.

A verseny során rendelkezésre bocsátott nagymennyiségű esemény- és betegadaton adatfeltárást végeztem, és létrehoztam számos új, nagy leíróerejű változót. Az így kapott adathalmazon többféle predikciós modellt építettem, és olyan modelleket is létrehoztam, amikben a predikciók több meglévő modell predikcióinak az egyesítésével álltak elő.

Az új változók létrehozását és a modellek építését felváltva, iteratív módon végeztem. A diplomamunka végére összesen 145 változót hoztam létre. Az ezen felépített legjobb egyesített modellel a versenyen induló 1659 csapatból a 65. helyet szereztem meg.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.