Előrejelzések frissítése gépi tanulással energiapiaci adatok esetén

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

Jelen szakdolgozat célja az, hogy energiapiaci adatok segítségével egy olyan előrejelzést adjunk az energiafelhasználást illetően, amely minél pontosabban tudja megközelíteni a valós értékeket. Ezt a feladatot adatbányászati módszerekkel lehet a leghatékonyabban elvégezni. Ennek első lépése az, hogy az adatunkat átformáljuk egy olyan alakra, amely gép tanulási algoritmusok számára fogyasztható. Ehhez ki kell bővítenünk az adathalmazt, új változókat fogunk felvenni, és megpróbáljuk ezek között feltárni az összefüggést az energiafogyasztással. A gépi tanulás során egy úgynevezett „Gradient Boosting Regressor” algoritmust fogunk használni. Ennek segítségével, a múltbéli adatok alapján felállítunk egy modellt, amely képes előrejelezni az energiafelhasználást. Az energiapiacon manapság kezd elterjedni, hogy a leadott becsléseinket lehetőségünk van módosítani az adott napon belül, ennek köszönhetően van rá módunk, hogy a friss adatok bevonásával módosítsuk a saját elképzeléseinket. Ki fogunk alakítani egy olyan rendszert, amely képes ezt a funkciót ellátni, vagyis az új adatokat be fogjuk venni a modellezésbe és ezáltal javítva az előrejelzésünket. Azt fogjuk látni, hogy a kezdeti kb. 2.5%-os átlagos abszolút hibaszázalékunk le fog csökkeni 1% alá. A gépi tanulás mellett egy másik alternatív módszert is megnézünk, a „hasonló napok” módszerét. Ez az algoritmus a tegnapi nap hullámfüggvénye alapján tud nekünk holnapra egy becslést mondani, ez csak egy statisztikai eljárás. A két megoldást végül össze fogjuk hasonlítani, az érdekel minket, hogy a plusz adat bevonásával hogyan változnak meg a hibaszázalékok egyik és másik esetben. Azt várjuk, hogy a gépi tanulás során jobb eredményeket tudunk elérni, ezt pedig látni is fogjuk a két diagramm összevetésével. A statisztikai módszernél a hibaszázalékunk nem fog minden esetben javulni az új adatok bevonásával, míg a gépi tanulás során ennek értéke szigorúan monoton fog csökkeni.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.