Mélytanulási (deep learning) algoritmusok vizsgálata nyílt hozzáférésű platform segítségével

OData támogatás
Konzulens:
Dr. Pataki Béla József
Méréstechnika és Információs Rendszerek Tanszék

A megerősítéses tanulás a gépi tanulás azon ága, mely szekvenciális döntési problémák megoldását keresi ismeretlen dinamikájú környezetekben. A tanulás során egy optimális stratégiát kíván kialakítani, mely az adott környezetben maximalizálja az összegzett jutalmak várható értékét. A megerősítéses tanulás egyik központi problémája, hogy hogyan találjuk meg a megfelelő egyensúlyt az ismeretlen környezet felderítése és kiaknázása között.

Az utóbbi években a gépi tanuláson belül használt mély neurális hálózatok rendkívüli népszerűségre tettek szert, így a hagyományos módszereken kívül megjelentek olyan ágensek, melyek az előfeldolgozott bemenetek helyett feldolgozatlan képek alapján képesek tanulni. A nyers képek használata pedig az állapottér drasztikus megnövelését jelentette.

Ahhoz, hogy hatékonyan tudjon tanulni az ágens, megfelelő felfedezési algoritmusokra is szükség van. A szakirodalomban fellelhető korábbi algoritmusok gyakran nem jól teljesítenek igen nagy állapottérrel rendelkező problémák esetén, így újabb, hatékonyan implementálható megoldásokra volt szükség.

Jelen dolgozat áttekinti a témakörhöz tartozó szakirodalmat, bemutatja a használt online keretrendszert, majd különböző, újabb felfedezési algoritmusokat mutat be és mér össze egy klasszikus, egyszerűbb de széles körben használt felfedezési stratégiával. Az implementált stratégiákat egy mély neurális hálóval használva az elért teljesítmény és futási idő szerint kiértékeli ezeket három különböző környezetben.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.