Objektum felismerés képadatbázisban mély neurális hálózatokkal

OData támogatás
Konzulens:
Dr. Gyires-Tóth Bálint Pál
Távközlési és Médiainformatikai Tanszék

A gépi látás egy több évtizedes kutatási terület. Egyik alappillére, hogy a rendszer képes legyen az objektumok detektálására, felismerésére és szegmentálására. Detektálás alatt az objektum jelenlétének észlelését és pozíciójának meghatározását, míg felismerés esetén az objektum kategóriájának/típusának a beazonosítását értjük. A szegmentáció pedig az előző két folyamat eredményeként kapott különböző objektumok területének képen való kijelölését takarja. Ilyen fejlesztésekkel ma már például mobiltelefonokban, biztonsági kamerák képét kezelő szoftverekben és önvezető autókban is találkozhatunk.

Szakdolgozatom célja a modern, mély konvolúciós neurális hálózatokat használó objektum detektáló módszerek megismerése és egy skálázható, mély neurális hálózat alapú objektum detektáló rendszer kidolgozása. A szakdolgozatom keretében létrehozandó rendszer két egységből áll. Az első egy skálázó eszköz, mely különböző képadatbázisok adatait képes egy egységes struktúrájú, kombinált adatbázissá alakítani. A rendszer második fele pedig egy, az ezeket az egységesített adatokat felhasználó, objektum detektáló konvolúciós hálózat.

Munkámat az objektum detektáló konvolúciós hálózatokkal kapcsolatos legfontosabb publikációk felkutatásával indítottam. Az elméleti oldal megvizsgálása után a megvalósítást pedig a skálázó szkript prototípusával kezdtem, majd a kész verzió elkészítése után a szoftver párhuzamosításával foglalkoztam. A konvolúciós hálózat esetén elsőnek egy meglévő és közepesen bonyolult módszer kompaktabb verzióját implementáltam, majd ennek eredményeit látva, megközelítés váltottam és egy korábbi, egyszerűbb hálózaton alapú koncepciót készítettem.

A skálázó szkript sikeresen megvalósításán kívül, implementáltam egy objektum detektáláshoz gyakran használt metrikát is. Ezenfelül előkészítettem az újragondolt rendszer alapjait az adatfeldolgozásban szükséges módosítások elvégzésével, majd ezeket párhuzamosítottam a jobb teljesítmény érdekében

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.