Képi alakzatok felismeréséhez programkönyvtár készítése

OData támogatás
Konzulens:
Dr. Szűcs Gábor
Távközlési és Médiainformatikai Tanszék

Általánosságban elmondható, hogy a XXI. század az informatika aranykora, az élet minden területén automatizálásra törekszünk. Szakdolgozatom fő célkitűzése a gépi látás témakörébe tartozó minta- és alakzatfelismerés problémájának a bemutatása.

Az elméleti háttér bemutatását követően a szakdolgozatom témájaként választott feladatot ismertetem magasszintű alakzatfelismerő modulok megtervezése, illetve megvalósítása által, amely összessége programkönyvtárként funkcionál. A megoldás képes valamennyi bemeneti képen számos alakzat detektálására, úgy mint háromszög, paralelogramma, téglalap, négyzet, nyolcszög és kör. Az implementációhoz a PyCharm fejlesztőkörnyezetet használtam, a modul Python nyelven íródott. A kezdeti modulok önálló tesztjeit egy 11205 darab képet tartalmazó, Kaggle weboldalról letöltött adathalmaz biztosította.

A megvalósítás második lépéseként a programkönyvtárat két irányba adaptáltam. Az UAH adathalmaz segítségével közlekedési táblák formájának tesztelésére, illetve az azonos síkidomok sorozatainak felismerésére, amely esetben az alakzatok távolsága közel egyenlő. Végül az adathalmaz képein végzett teszteredményeket ismertetem, továbbfejlesztési lehetőségeket fogalmazok meg.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.