Vizualizációs megoldás fejlesztése LogitBoost alapú osztályozó eljáráshoz

OData támogatás
Konzulens:
Nagy István
Távközlési és Médiainformatikai Tanszék

A modern kor embereként számtalan módon kerülhetünk kapcsolatba a világot ellepő információáradattal. Találkozhatunk vele a TV-ben, a rádióban, különböző nyomtatott formákban, vagy a mára már mind többek által elérhetővé váló internetes oldalakon. A törekvés, hogy könnyebben és eredményesebben tudjuk kiszűrni és értelmezni a számunkra fontos információt a rendelkezésre álló adatokból, alapjaiban határozta meg az informatika fejlődését.

Ez eredményezte azt, hogy az adatok számítógép segítségével történő grafikus ábrázolásának módszerei és technikái mára már egy önálló tudományággá nőtték ki magukat, amit információ vizualizációnak (IV) nevezünk. Ezzel szinte egy időben kezdett fejlődésnek indulni egy másik interdiszciplináris terület, az adatbányászat (DM), amely esetenként hatalmas adathalmazokban keres mintákat, és szűri ki a hasznos információt statisztikai módszerek vagy egyéb algoritmusok felhasználásával. Napjainkban ez a két tudományág egyre gyakrabban fonódik össze, így megalapozva a vizuális adatelemzés, mint az IV egy ágának, létjogosultságát.

Dolgozatom célja kettős: megértetni az IV fontosságát, valamint rálátást adni, miként segítheti az IV alkalmazása a DM eredményeinek könnyebb megértését.

Dolgozatom egyrészt betekintést fog nyújtani az IV által jelenleg használt megoldásokba, megvizsgálja ezek előnyeit és hátrányait, valamint összeveti az általa támogatott és a hagyományos adatelemzési módszereket. Másrészt pedig a munkám példát ad a két terület egy lehetséges kooperációjára, amit egy általam fejlesztett vizuális adatelemzést támogató alkalmazáson keresztül mutat be. A program egy újnak mondható osztályozó algoritmus, a LogitBoost működését, eredményeit jeleníti meg egy példa adathalmazt felhasználva, miközben lehetőséget biztosít az algoritmus interpretálhatósági nehézségeinek enyhítésére.

A dolgozatomban kitérek a fejlesztés lépéseire valamint arra, hogy a felhasznált technológiák miként tudnak együttműködni. Az eredmények elemzésén kívül rávilágítok azon problémákra, amelyek felmerültek a munkám során a tervezéstől egészen a megvalósításig. Legvégül pedig összefoglalom az alkalmazásomban rejlő további lehetőségeket.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.