Keretrendszer mélytanulási eredmények kiértékelésére

OData támogatás
Konzulens:
Dr. Hullám Gábor István
Méréstechnika és Információs Rendszerek Tanszék

Egy mély tanuló algoritmus lefutása után a következő lépés jellemzően egy átfogó kiértékelés, mely arra szolgál, hogy eldöntsük, sikerült-e egy robosztus, stabil és pontos modellt alkotnunk vagy sem. Az értékelésnek több fajtája van, a dolgozatban bemutatott keretrendszer az ismételt K-szoros keresztvalidációt használja. Ahhoz, hogy hatékonyan menjen a tanítás, először az adathalmazt át kell alakítani olyan formátumba, hogy azt a keretrendszer, ami a kiértékelést végzi, könnyedén használhassa. Az átalakítás során a vesszővel elválasztott szöveges formátumot át kell konvertálni bináris formátumba és a hiányzó adatokat feltölteni értékkel. A bináris formátumnak a Python sorosító formátumát, a Pickle formátumot választottam, a hiányzó értékeket pedig a jellemzők eloszlásának függvényében, sorsolással kapott értékekkel helyettesítettem. A keretrendszer a modelltől kapott eredmények segítségével teljesítmény mutatókat számol keresztvalidációs lépésenként, és ezeket elmenti a merevlemezre későbbi adatelemzés és vizualizáció céljából. Az adatelemzés során sokszor ugyanazt a feladatot kell elvégezni, például egy táblázatkezelőben, aminek egy része jól automatizálható.

Az elemző munkájának segítésére készült a dolgozatban bemutatott keretrendszer, ami időt takarít meg, ezáltal több idő jut az elemzőnek a komplexebb feladatok elvégzésére. A keretrendszer elvégzi az adathalmaz átalakítását, az eredmények kiértékelését és vizualizációját. A elkészített ábrák és táblázatok egy böngészőben jelennek meg, biztosítva a platform független elemzést, hiszen akár laptopon, akár okostelefonon pillantást lehet vetni a kiértékelt adatokra. Ehhez futtatni kell egy Bokeh szervert, ami egy Python kiegészítő csomag az interaktív vizualizációhoz.

A keretrendszer jelenleg genetika adathalmazokon végzett osztályozási feladatokra lett tervezve, de ez kiegészíthető, átalakítható más problémák megoldására és egyéb mutatók számítására, vizualizációjára is.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.