Parkolóhely felismerés és megjelenítés szemantikus szegmentációval

OData támogatás
Konzulens:
Kovács Viktor
Automatizálási és Alkalmazott Informatikai Tanszék

Az automatikus parkolás egy fontos lépés az önjáró autók megvalósításához, melynek számos feladata van. Először is az autó képes kell legyen szabad parkolóhely detektálására a szenzorjai alapján (kamera, ultraszonikus szenzor, stb.). Ezután a parkolás trajektóriáját kell meghatározni. Végül az autónak végre kell hajtania a parkolást a kiszámolt trajektória mentén, elkerülve bármilyen ütközést. Ez a dolgozat a szabad parkolóhely felismerésére fókuszál, egy autóba beépített kamera videóképét használva.

A mély neurális hálózatokon alapuló módszerek egyre elterjedtebbek a képfeldolgozásban, mint például az objektum felismerésben. Továbbá a konvolúciós neurális hálózatok figyelemre méltó eredményeket értek el kép alapú szemantikus szegmentációban. A szemantikus szegmentációnak az a feladata, hogy egy bemeneti kép minden egyes képpontját különböző, például autó, úttest, gyalogos, épület osztályokba sorolja. Az egyre növekvő számítási kapacitás hatására a konvolúciós neurális hálókon alapuló szemantikus szegmentáció modellek egyre pontosabb eredményeket képesek elérni valós időben.

Ennek a dolgozatnak a kontribúciója kettős. Először is egy felhasználói felületet tervezek meg, ahol a felhasználó kölcsönhatásba léphet a kamera videóképével. Olyan funkciókat implementálok, melyek lehetővé teszik a felhasználó számára, hogy intuitív módon határozzon meg parkolóhelyeket a kamera képen. Továbbá implementálok egy algoritmust, mely kiszámítja a kamera képen megadott parkolóhely pozícióját és orientációját a 3D-s valós koordinátarendszerben a kamerához viszonyítva. Ezt a felhasználói felületet az OpenGL könyvtár segítségével implementálom Python-ban.

A dolgozat következő részében a SegNet modell implementációjával kísérletezek. Első lépésként a fent említett felhasználói felületet integrálom az implementációval. Ezután adaptálom a modellt a szabad parkolóhelyek szegmentálásának feladatára. Számos módosítással kísérletezek, mind a modell architektúrájában mind a hiperparaméterek állításában. Az egyik ilyen módosítás a normál konvolúciós réteg lecserélése mélység szerint szétválasztható konvolúciókkal. Azt is megvizsgálom, hogy hogyan befolyásolja a modell teljesítményét a tanító adathalmaz méretének változtatása. Végül több száz különböző tanítás alapján részletes elemzést végzek arról, hogy az általam végrehajtott módosítások hogyan befolyásolják a modell pontosságát és futási sebességét.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.