Nagy pontosságú gesztusfelismerő rendszer fejlesztése

OData támogatás
Konzulens:
Prekopcsák Zoltán
Távközlési és Médiainformatikai Tanszék

Újabb és újabb hordozható elektronikai eszközök jelennek meg, amelyekhez a fejlesztők igyekeznek minél inkább felhasználóbarát kezelési módszereket kitalálni, megalkotni. A kijelzővel rendelkező készülékek, mint például az okostelefonok között az újdonságot az érintőképernyő jelentette, amely a hagyományos, klaviatúrás megoldásnál dinamikusabb volt, kényelmesebb volt a használata, és több lehetőséget rejtett. Mindazonáltal az érintőképernyő sok hátrányos tulajdonsággal is rendelkezik. A képernyőnek elég nagynak kell lennie, hogy pontosan eltaláljunk egy-egy gombot, viszonylag nagy a számításigénye, ezért jelentősen lerövidíti az akkumulátor élettartamát, az eszközt mindenképpen a kezünkben kell tartani, hogy irányítani tudjuk, és így tovább. Az áttörést a manapság feltörekvőben lévő kézi gesztus alapú interfész hozhatja meg, amely a kézmozdulatok által történő irányítást teszi lehetővé. Ilyen irányú próbálkozások, kísérletezések már régóta folynak, de igazán kiforrott technológiák csak az utóbbi években születtek. A technológiák közötti verseny alapja a mozdulat-felismerési algoritmusok közötti különbség, melyek célja számításigény minimalizálása, és egyben a pontosság maximalizálása. Az eddigi leghatékonyabb eredményekkel a Gesthaar nevű gesztusfelismerő rendszer alkotói álltak elő, ez a munka inspirálta kutatásaimat is.

Dolgozatomban bemutatásra kerülnek a gyorsulásmérő-alapú kézi gesztus felismerésének különféle módszerei. Ismertetem a jelentős lényegkiemelő eljárásokat, köztük a Haar Wavelet transzformációt és az egyszerű jellemző-kiválasztást, amelyek az eredeti, gyorsulásmérő által szolgáltatott zajos jelekből ténylegesen használható, megkülönböztető tulajdonságokat állítanak elő. Részletezem az ezen a területen leginkább elterjedt két mintázatfelismerő eljárást, a rejtett Markov modell (HMM) és a szupport vektor gép (SVM) alapú osztályozót. Áttekintem a tervezői döntéseket, amelyben a saját gesztusfelismerő rendszerem tervezésének körülményeit, és a tesztkörnyezet kialakítását vázolom. A megvalósítás menetére, valamint a tesztesetek eredményeinek elemzésére, amik a további fejlesztési folyamatot is befolyásolták, ezután kerül sor. Ebben a részben derül ki, hogy a gyors Haar transzformáció és az SVM együttes használatával, jó paraméterezéssel, milyen módon érhető el végül 96%-nál magasabb felismerési arány, 10 elemes kódszótár esetében.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.