Autonóm drón irányítása deep reinforcement learninggel

OData támogatás
Konzulens:
Budai Ádám
Automatizálási és Alkalmazott Informatikai Tanszék

A pilóta nélküli repülőgépek - vagy ismertebb nevükön drónok - fejlődésével és kereskedelmi forgalomban való elterjedésével izgalmas és kihívást jelentő kutatási terület nyílt meg a mérnökök előtt. Segítségükkel számos - korábban jelentős emberi erőforrást igénylő - feladat elvégzése vált lehetségessé, mint például erdőtüzek felderítése [1], az egészségügyi vészhelyetek kezelése [2] vagy a vadállomány védelme [3], csak hogy néhányat említsünk. A két legfontosabb képességük, hogy rendkívül jó minőségű légifelvételek készítésére is alkalmasak és szinte bárhova képesek eljutni. Azonban a megfelelő felvételek elkészítéséhez még mindig jelentős emberi támogatásra van szükség különösen, ha több drónból álló flották irányításáról van szó (bár ezen a területen is sikerült már jelentős áttöréseket elérni, gondoljunk csak a [4] magyar vonatkozású kutatási eredményekre).

Dogozatomban arra keresem a választ, hogy miként lehet megerősítéses tanuláson alapuló algoritmusok segítségével kiváltani - legalább is minimalizálni - az emberi tényezőt, és idővel teljesen önálló vezérlésre és feladatvégrehajtásra alkalmas drónokat fejleszteni. Ehhez egy olyan pehelysúlyú (angolul:lightweight) konvolúciós neurális hálót tervezek, amely pusztán a drón kameraképe alapján képes az eszközt az elvárt módon navigálni. Tanulmányom egy fontos aspektusa a háló méretének csökkentése és a lehető legrövidebb átfutási idő (a kamerakép beérkezése és a vezérlési parancs kiadása között eltelt idő) elérése annak érdekében, hogy később valós körülmények között valós eszközre is telepíthető legyen. Kutatásom jelenlegi szakaszában egy általam fejlesztett virtuális környezetben tesztelem több ismert tanuló algoritmussal a háló tanulási sebességét és korlátait, miközben igyekszem megtalálni a legoptimálisabb strukturális felépítést.

A tanulás során az algoritmus folyamatosan képeket kap egy emberi alakról, és az a feladata, hogy apró, néhány fokos lépésekkel haladva a virtuális térben megfelelő pozícióba navigálja magát, majd az általunk elvárt - jelen esetben éppen szemből fotózott - képeket készítsen. A tanuláshoz 15 különböző virtuális emberi alakot használok fel.

Dolgozatom első fejezetében ismertetem a megerősítéses tanuláshoz kapcsolódó legfontosabb fogalmakat és a konvolúciós hálók működését. Ezt követően kitérek a drón vezérléséhez használt, jelenleg már ismert megoldásokra, azok előnyeivel és korlátaival együtt. Végül bemutatom az általam tervezett pehelysúlyú konvolúciós neurális hálót a felhasznált tanuló algoritmusokat és a kutatás eredményeit, valamint kitérek a projekt további fejlesztési irányaira.

[1] Wolfgang Krüll, Robert Tobera, Ingolf Willms, Helmut Essen, and Nora von Wahl. Early forest fire detection and verification using optical smoke, gas and microwave sensors. volume 45, pages 584-594. Procedia Engineering, 2012.

[2] A. Claesson, D. Fredman, L. Svensson, M. Ringh, J. Hollenberg, P. Nordberg, M. Rosenqvist, T. Djarv, S. Österberg, J. Lennartsson, et al. Unmanned aerial vehicles (drones) in out-of-hospital-cardiac-arrest. volume 24, page 124. Scandinavian journal of trauma, resuscitation and emergency medicine, 2016.

[3] Astrid Gynnild. The robot eye witness: Extending visual journalism through drone surveillance. volume 2, pages 334-343. Digital journalism, 2014.

[4] Gábor Vásárhelyi, Csaba Virágh, Gergő Somorjai, Tamás Nepusz, Agoston E. Eiben and Tamás Vicsek. Optimized flocking of autonomous drones in confined

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.