Tanuló ágensek tanítása számítógépes játékok kezelésére

OData támogatás
Konzulens:
Engedy István Tamás
Méréstechnika és Információs Rendszerek Tanszék

A szakdolgozat keretein belül a megerősítéses tanulás alkalmazását vizsgálom egy számítógépes játékon. Ehhez a Tetrist választottam környezetnek, mivel ez egyszemélyes játék, amiben egy ágens pusztán a környezet érzékelésével is tud boldogulni, nem kell más ágensek működésével számolnia. Az ágens feladata, hogy a választott játékban megtaláljon egy optimális stratégiát.

A vizsgált játékhoz egy állapotleírást kell találni, ami a megerősítéses tanulás alapjául szolgál majd. A megerősítéses tanuláshoz szükséges továbbá, hogy az ágens jutalmat kapjon a cselekvései során. A jutalmak, és a tanításhoz szükséges egyéb paraméterek súlyozását különböző tesztek alapján vizsgálom meg.

Ezután megnézem az ágens tanulási sebességét, az erre vonatkozó paraméterek vizsgálatával. Értékelem a megtanult stratégia minőségét az elért eredmény alapján. A megerősítéses tanulásra vonatkozó algoritmust a feladat speciális változataival tesztelem. Végül értékelem a tapasztaltak alapján a tanuláshoz használt állapotleírást.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.