Idősorok klaszterezése

OData támogatás
Konzulens:
Dr. Pataki Béla
Méréstechnika és Információs Rendszerek Tanszék

Jelen diplomaterv idősorok feldolgozását és rajtuk alkalmazott klaszterezési eljárások bemutatását tűzte ki célul. Az idősorokat a New York-i értéktőzsde S&P100 indexének részvényei jelentik. A klasszikus klaszterezési eljárások típusai közül mind partíciós, mind hierarchikus típus bemutatásra kerül. A bemutató leírásokon túl két eljárás (egy partíciós – egy hierarchikus) alkalmazása is megvalósult, melyeknek révén a tőzsdei részvények klaszterekbe sorolódtak. A fentieken túl adatfeldolgozási technikák bemutatása és alkalmazása is a dokumentum tárgya, abból a célból, hogy a klaszterezési eljárások minél látványosabb eredményt érjenek el. A munkában továbbá távolságmetrikai vizsgálatok találhatók, hiszen a távolság definiálása az egyik alappillére a klaszterezési algoritmusoknak.

Az algoritmusok bemutatásához elengedhetetlen azok tesztelése mind szimulált, mind valós adatokon, így működésük összehasonlítható. A tőzsdei adatok klaszterezésének eredménye pedig összehasonlítható a részvények természetes jellemzőin alapuló csoportosítással. Ennek eredményeképp megállapítható, hogy mekkora átfedés van az elemzett csoportosítások között.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.