Adatbányászati módszerek szélenergia termelés előrejelzéséhez

OData támogatás
Konzulens:
Nagy Gábor
Távközlési és Médiainformatikai Tanszék

Napjainkban az emberiség egyre inkább szembesül a fosszilis energiahordozók végességével, illetve az általuk okozott környezeti károkkal. A nem megújuló energiahordozók egyre fokozottabb kiaknázása miatt, egyre inkább előtérbe kerül a megújuló energiaforrások felhasználása. Az ily módon történő energia-kitermelés, azonban nagy kihívások elé állítja a villamos hálózatok üzemeltetőit. Különösen a tervezhetőség szempontjából jelent igen nagy kihívást a megújuló energiaforrásokra épülő energiatermelés. Dolgozatomban erre a problémára kínálok megoldási javaslatot. A megújuló energiaforrások közül a szélenergia-kitermelés előrejelzésére fókuszáltam. Diplomamunkámban 22 szélfarm kitermelésének rövidtávú, 6 és 24 órás előrejelzését végeztem el statisztikai és adatbányászati modellek segítségével.

Elemzésemhez két adatbázist használtam fel. Az egyik a szélfarmok kihasználtságát tartalmazza 2012-re és 2013-ra vonatkozóan, melyet az AEMO honlapjáról töltöttem le. Mivelhogy a szélenergia-kitermelés időjárásfüggő, ezért a másik adatbázis ugyanerre az időszakra vonatkozó időjárás előrejelzés adatokat tartalmazza. Utóbbit az ECMWF oldaláról töltöttem le.

Az adatok feldolgozását a CRISP-DM módszertan lépéseivel hajtottam végre. A modelleket azonos, mozgóablakos validációs eljárással futtattam és az összehasonlításukat hibametrikákkal végeztem el. A modelleket egy alap ARMA modellel állítottam szembe, majd pedig a 6 órás előrejelzéseket a 24 órásokkal is összehasonlítottam.

A kutatás eredményeképpen elmondható, hogy a rövidebb, 6 órás előrejelzés esetén a gradient boosting regresszor, a random forest regresszor és az armax modellek hozták a legjobb előrejelzéseket. Hosszabb, 24 órás előrejelzés esetén az ARMAX modell már rosszabbul teljesített, még az ARMA modellnél is, még a gradient boosting és random forest regresszorok továbbra is a legjobb eredményeket mutatták. Az adatok pontossága és minél tágabb hasznosítása - gondolok itt például az adatok formázására, új változók bevezetésére – különösen fontos szereppel bír a szélenergia-kitermelés előrejelzésében. A modellek közül a 10 és 30 km közötti távolság a szélfarmok és az időjárás előrejelzés helye között, nem befolyásolta egyértelműen a modellek eredményét.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.