Mély megerősítéses tanulás alapú interakció végrehajtás webes felhasználói felületeken

OData támogatás
Konzulens:
Dr. Gyires-Tóth Bálint Pál
Távközlési és Médiainformatikai Tanszék

Az utóbbi években a nagy párhuzamos számítási kapacitással rendelkező GPU-k fejlődésével lehetővé vált sokkal nagyobb számításigényű problémák gyors megoldása. A neurális hálózatok a GPU-kon való tanítása, jelentősen meggyorsította a kísérletek futtatását a CPU-khoz képest, mert ezen modellek esetén rétegenként sok egymástól független paramétert kell kiszámolni, amire a párhuzamos számítási kapacitás kimondottan megfelel. Emellett sokkal nagyobb adathalmazok is létrejöttek, amelyek szintén hozzájárultak ahhoz, hogy jelentős sikereket érjenek el mélyebb architekturák alkalmazásával.

A deep learning segítségével bonyolult feladatokat (mint például képek osztályozása) jobban meg tudtak oldani, mint korábbi hagyományosabb módszerekkel, így nagyobb figyelmet kapott mind a kutatók, mind a közvélemény szemében. Ma már a deep learning a gépi tanulás egyik legjelentősebb kutatási területe.

A megerősítéses tanulást kiegészítve a mély neurális hálók használatával a DeepMind nevű cég számos nagy áttörést ért el: deep learning-et kombinálták Q-tanulással például azért, hogy ATARI játékokat illetve Go-t játszó ágenseket készítsenek. Ezek az ágensek egyedül a képi információ, és a játék pontszámának felhasználásával az emberinél jobb teljesítményt értek el. A megerősítéses tanulás kutatása is fellendült, és ezen a területen is több új módszert fejlesztettek ki.

A mély megerősítéses tanulást játékokon kívül számos más problémára is lehet alkalmazni. Szakdolgozatom célja az, hogy megvizsgáljam, hogy mennyire használhatók a mély megerősítéses tanulás egyes módszerei arra, hogy ágensek grafikus felhasználói felületeken hajtsanak végre megadott feladatokat. Kísérleteim során a Mini World of Bits benchmark webes demonstrációs mintafelületeit használom.

A mély Q-tanulás módszerét alkalmazom több különböző nehézségű feladatra, majd elemzem hatékonyságát.

Végül azt vizsgálom, hogy mennyire terjeszthető ki a megoldásom egyéb, a benchmarkon kívüli weboldalakra.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.