Piaci folyamatok elemzése big data technikákkal

OData támogatás
Konzulens:
Marton József Ernő
Távközlési és Médiainformatikai Tanszék

A pénzügyi piacok felfoghatóak komplex dinamikus rendszerekként, melyek folyamatos interakcióban állnak a hírekkel, politikai és gazdasági környezettel, ez által hatalmas adatmennyiséget generálnak. Egyrészről ez lehetőséget ad a hagyományos árfolyam előrejelzési technikák fejlesztésére új típusú információk bevonásával az elemzésbe, más részről pedig kihívást jelent a legújabb Big Data technológiák használatában.

A diplomamunkám a Big Data fogalom rövid bemutatásával kezdődik, majd az Oracle által nyújtott Big Data megoldások ismertetésével folytatódik. Az Oracle Advanced Analytics platformot használtam, mely az Oracle adatbázis szervert kiegészíti az Oracle R-el, lehetőséget adva beágyazott R scriptek futtatására az adatbázis szerveren.

Ezután megismertem a fő lépéseit a pénzügyi idősorok elemezésének fő lépéseit, kezdve az elterjedtebb idősor előrejelző modellek áttekintésével (pl. additív és multiplikatív modellek). Tanulmányoztam az idősorok dekompozícióját és a hagyományos statisztika alapú előrejelzési modelleket, többek között az egyszerű exponenciális szűrést és a Holt-Winters modellt. Áttekintettem az árfolyamok előrejelzésének újszerű irányzatait, a hírek hangulat elemzésére fókuszálva.

Dolgozatom második felében egy alkalmazást terveztem és készítettem el, mely segítségével lehetővé válik a pénzügyi adatok valós idejű gyűjtése, tárolása, elemzése és vizualizációja az R programnyelvet használva. Szótár alapú hangulat elemzést alkalmaztam, hogy vizsgáljam, vajon a számszerűsített piaci hangulat indikátora lehet-e a jövőbeli árfolyamoknak.

A Harvard General Inquirer és a Bing Liu vélemény lexikonokat felhasználva és összehasonlítva elemeztem a piaci hangulat és a különböző piaci indikátorok közötti korrelációt. Az értékelési fázisban megállapítottam, hogy említésre méltó korreláció (0.34) tapasztalható a napi hangulat értékek és a napi hozamok között, melyet a szótárak súlyozott kombinációját használva növelnem sikerült (0.42).

Keresztkorrelációt és Granger-kauzalitás teszttel vizsgáltam, hogy a piaci hangulat befolyásolja-e a hozamokat adott időeltérés mellett. Azt az eredményt kaptam, hogy a hírek hatása nagyon hamar érződik az árfolyamokban, a legnagyobb korreláció az első napon van, a kapcsolat pedig inkább ellentétes, a hírek reagálnak az árfolyamok változására 1-2 napos késéssel.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.