Tőzsdei hangulat elemzése adatbányászati módszerekkel

OData támogatás
Konzulens:
Nagy Gábor
Távközlési és Médiainformatikai Tanszék

A tőzsdén való kereskedés a modern gazdaság motorja, a kor nagy kérdése, hatékony-e ez a motor, és, ha nem, hogyan lehet ezt a tökéletlenséget megragadni. Dolgozatomban hangulatelemzési módszerek segítségével próbálok betekintést nyerni a pénzügyi viselkedéstan eredményei által motiválva, a közvélemény árfolyamra gyakorolt hatásába.

Egyfelől a megfelelő források kiválasztásával foglalkozom, melyek a legnagyobb haszonnal kecsegtetnek adatbányászati szempontból. Választásom a 40 legjelentősebb gazdasági híroldal cikkeinek, illetve a Twitter valós idejű folyamának követésére esett, ehhez saját adatgyűjtő és tároló alrendszereket építettem.

Másfelől a kibányászott adatokon kétféle eljáráscsalád, a hangulat-szótárakra épülő és a gépi tanuló módszerek eredményességét hasonlítom össze.

Arra a megfigyelésre jutottam, hogy a híroldalakon bizonyos lexikon alapú osztályozás sikeresen felülmúlja az S&P 500 index egyszerű megvesz és tart stratégiáját (buy&hold). Egyéb lexikonok, illetve a gépi tanulás, ezen belül is a Naív Bayes módszer viszont alulteljesítik azt.

A Twitter üzenetek körében pont fordított helyzetet találtam, vagyis a lexikonon alapuló módszerek erősen elhajlottak a pozitív osztályok irányába, így nem voltak képesek előnyhöz jutni az indexhez képest, a Naive Bayes osztályozó azonban jelentősen jobb eredményt ért el.

Fontos megemlíteni, hogy a kereskedés a jelenlegi emelkedő piaci környezetben (bull market) szimulálva nem adhat teljes képet az eljárások minden körülmények közötti robosztusságára, hiszen ilyenkor viszonylag kevés negatív nap kiszúrásával megismételhető a fenti stratégiák hozama.

Következtetésként arra jutottam, hogy a megelőző munkákkal egybecsengően a hírforrásokra épülő gépi tanulás tőzsdei árfolyam előrejelző képessége kívánnivalót hagy maga után, a Twitter tömör információtöltetéből táplálkozó kutatásoknak viszont reményre ad okot.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.