Idősoros adatattribútumok összefüggőségeinek vizsgálata gépi tanulás során

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

Az idősorok olyan adathalmazok, amelyekben az adatok értéke mellett időbeliségük is fontos információt hordoz. Az ilyen típusú adatok adatbányászati feldolgozása speciális technikát igényel. A szakdolgozatomban a szakirodalomban talált források alapján bemutatásra kerülnek röviden az idősoros adatbányászati feladatok fő jellegzetességei. Az egyes vizsgált szekvenciákon a bemeneti adatok függvényében a felügyelt tanítású előrejelző modell alapján kapott eredményeket az un. parciális részfüggőségi diagramon szemléltethetjük.

Egy Python programban részfüggőségi diagramot generáló alkalmazást fejlesztettem, amelyet először egy mesterségesen előállított adathalmazon teszteltem. A tanító adathalmaz 3 változót tartalmazott: két szinuszos hullámot és a megfigyelések időpontjait. A célváltozót a bemeneti változók segítségével formális képlettel határoztam meg. A részfüggőségi értékeket a mesterséges adathalmaz eredeti értekeivel együtt ábrázoltam. Az általam írt Python szkript alkalmazással a parciális függőség eredményeit egy mozgóképes felvétellé fűztem össze, így folyamatos szekvenciákban szemléltethető vált az egyes bemenő adatok által generált predikció hatása.

Következőkben a HUPX, a magyar villamos energiatőzsde, 2013 és 2016 közti órára lebontott valódi forgalmi adatain futtattam a programot. A gördülő ablakos kiértékeléssel kapott animáció segítségével folyamatosan monitorozhatóvá vált a parciális részfüggőség alakulása.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.