Konfigurálható gépi látás alapú marker követő keretrendszer

OData támogatás
Konzulens:
Vörös András
Méréstechnika és Információs Rendszerek Tanszék

Az elmúlt néhány évben a gépi látás széles körben elterjedt technológiává vált. Alkalmazzák virtuális válóság alapú alkalmazásokban, gépi látással támogatott biztonsági rendszerekben, video bírókban, forgalom számlálókban, gyalogos megfigyelő rendszerekben, autonóm robotokban stb.

A hardverek nagymértékű fejlődése mindenki számára elérhetővé tette a gépi látás alapú megoldásokat. Használható emberi arcok és testek felismerésére, megfigyelt tárgyak 3D rekonstrukciójára, marker alapú tárgy felismerésre és követésre stb. Ezeket a feladatokat nehéz lenne gépi látás nélkül megoldani, más technológiák nem lennének megfelelőek. A legnagyobb előnye az, hogy nincs szükség fizikai kapcsolatra, a kamerák a megfigyelt tértől távol helyezkednek el. A gépi látás gyakran alkalmazható fizikai rendszerek egy vagy több kamerával történő megfigyelésére. Ennek célja a fizikai rendszerben lévő tárgyak pozíciójának meghatározása. Ezt az információt a fejlesztők különféle módokon használják fel, attól függően, hogy éppen milyen szoftveren dolgoznak.

Ezen fizikai rendszerek sokfélesége és a környezeti feltételek változékonysága miatt a gépi látás alapú megoldások általában egy konkrét problémára adnak speciális megoldást. Az korábban fejlesztett komponensek csak abban az esetben használhatók újra, amennyiben az új probléma nagyon hasonló az előzőhöz. A fejlesztőknek komoly háttér tudásra van szüksége ahhoz, hogy ezt a technológiák hatékonyan tudják használni. Egyetlen tárgy követéséhez is több alacsonyabb és magasabb szintű képfeldolgozó algoritmus megfelelő kombinációja szükséges. A legnagyobb nehézséget az jelenti, hogy ezen algoritmusok felhasználási módja és paraméterezése sokszor nem egyértelmű, sok idő ezeket megtanulni.

A munkám során fejlesztettem egy konfigurálható, nyílt forráskódú, platform független gépi látás keretrendszert, ami lehetővé teszi a fejlesztők számára, hogy gépi látás alapú tárgy követést integráljanak a rendszerükbe az ehhez szükséges speciális háttér tudás nélkül. Ez a dokumentum bemutatja a tervezés menetét és a megvalósítás részleteit, illetve tartalmaz egy útmutatót a keretrendszer telepítéséhez és használatához.

Természetesen a keretrendszer célja nem a gépi látás forradalmasítása. Ez egy eszköz, ami egy absztrakciós réteget képez az alacsony szintű képfeldolgozás, párhuzamos programozás, hálózati kommunikáció és a kamera kezelés fölött. Egy egyszerű web kamerával és fejlett több kamerás rendszerekkel is képes működni. A konfigurációs nyelv lehetővé teszi a felhasználók számára, hogy példányosítsák a számukra szükséges modulokat és beállítsák a paramétereiket. A konfiguráció alapján a keretrendszer képes meghatározni a tárgyakon elhelyezett markerek pozícióját. Az aktuális pozíció adatokat lokálisan vagy egy hálózati interfészen keresztül lehet elérni. A jól definiált interfészek és az egységes adat szerkezetek egyszerűvé teszik a keretrendszer új modulokkal való kiegészítését.

A fő cél egy olyan összetett keretrendszer kidolgozása, amely minél szélesebb körben, minél egyszerűbben használható. A beépített modulok segítségével képes egy általános szolgáltatást nyújtani, illetve ad egy fejlesztői környezetet, ami megkönnyíti az új marker követő megoldások fejlesztését.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.