Megerősítéses tanulás módszereinek vizsgálata

OData támogatás
Konzulens:
Engedy István Tamás
Méréstechnika és Információs Rendszerek Tanszék

Napjainkban a mesterséges intelligencia egyre jelentősebb szerepet tölt be az emberek éltében. Az orvosi, ipari és otthoni környezet mellett a különböző játékokban is megjelenik. Az egyik elterjedt típusa a megerősítéses tanulás, amely többek között a különböző játékokhoz szolgáltat egyfajta intelligenciát. A megerősítéses tanulás egy olyan tanulásfajta, amely során az ágens egy adott környezetben mozog, cselekszik és megfigyel, miközben az ilyen módon szerzett tapasztalatai alapján növeli a tudását és fejleszti a viselkedését, hogy a lehető legjobban tudjon boldogulni az adott térben. A megerősítéses tanulásnak számos területe és módszere létezik. A szakdolgozatom során kettővel foglalkoztam behatóbban: a Q-tanulással és az ADP-vel. Az algoritmusok megvalósításához, vizsgálatához, teszteléséhez és megjelenítéséhez egy saját feladatot találtam ki, amely nagyban hasonlít az ismert Pacman játékhoz. A célja, hogy a játék egyetlen tudatos szereplője kijusson egy labirintus-szerű pályáról, úgy, hogy a pályán lévő többi szereplő ne kapja el. A számításokat és az eredmények kiértékelését, valamint megjelenítését Matlab segítségével végeztem.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.