AR Drone 2.0 irányítása neurális hálózattal ROS környezetben

OData támogatás
Konzulens:
Csorvási Gábor
Automatizálási és Alkalmazott Informatikai Tanszék

A quadcopterek (négyrotoros drónok) a legelterjedtebb pilóta nélküli, kisméretű légi járművek közé tartoznak, elsősorban egyszerű felépítésük és jó manőverezőképességük okán.

Jelen szakdolgozat célja egy quadcopter pozíciószabályzásának megvalósítása. A szabályzás neurális hálózattal történik, melyet megerősítéses tanítással tanítottam be. A megerősítéses tanulás a gépi tanulás egy formája, mely során a tanuló gép a valós vagy szimulált környezettel való interakció során, próbálkozás útján tanulja meg a feladat megoldására alkalmas viselkedést.

A tanulás szimulációban történt, amit a drón dinamikai modellje alapján programoztam, és ROS (Robot Operating System) környezetben teszteltem. A tanítás során az OpenAI Baselines kódbázis TRPO (Trust Region Policy Optimization) és PPO (Proximal Policy Optimization) algoritmusait használtam.

A tanítás során kapott szabályzó egy PD szabályzó és egy neurális hálózat együttese, amely véletlenszerű kiindulóhelyzetből képes elérni egy meghatározott célpontot.

A rendszer működését szimulált környezetben teszteltem. A szimulációban a PD szabályzóval kiegészített neurális hálózat alapú szabályzó lényegesen gyorsabban érte el a célt, mint a PD szabályzó önmagában.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.