Csoportok keresése nagy képhalmazban passzív és aktív tanulással

OData támogatás
Konzulens:
Dr. Szűcs Gábor
Távközlési és Médiainformatikai Tanszék

Napjainkban óriási népszerűségnek örvend a fényképezés, hiszen szinte mindenki tart magánál egy okostelefont, mellyel megörökíti életének eseményeit, majd feltölti egy képmegosztó oldalra (pl. Instagram, Facebook) vagy felhőbe. Képeinket szeretjük rendezetten tárolni (pl. barátainkkal, kisállatunkkal, ételünkről készült képek), de ezt a csoportosítást nagy képszám esetén nem szívesen végzi el az ember, ezért jelentős igény van az ezt megvalósító rendező algoritmusokra. Ezek az algoritmusok egybe gyűjthetik a (valamilyen szempontból) hasonló képeket, és a gyűjtés eredménye lehet a hasonló kép párok (vagy akár nagyobb csoportok) rendezett halmaza. A szakdolgozatomban az összetartozó kép párok/csoportok keresésével kapcsolatos munkámat foglaltam össze, mely minden olyan felhasználónak hasznos lehet, aki törölni szeretné a majdnem duplikátumokat, vagy meg szeretné találni az összetartozó képeket, ezáltal könnyebben szeretné menedzselni a képeit. A dolgozatomban bemutatom, hogy milyen módon határoztam meg a hasonlósági függvényt, hogy a kép párok között (vagy csoporton belül) a hasonlósági értékek nagyok, míg a többi esetben kicsik legyenek. A hasonlóság megalkotásához először tömörebb formában kell leírnunk a képeket, vagyis jellemzőket/leírókat kell kinyernünk belőlük, ehhez én a Scale-Invariant Feature Transform (SIFT) leírót használtam erre. Ezután bemutatom azt az általam kidolgozott párkereső algoritmust, amely segít kijavítani a hasonlósági függvény hibáit és képes megtalálni az egymáshoz közeli elemeket, ezzel jelentősen javítva a csoportosítás hatékonyságát is. A módszerem kiértékelése érdekében egy nemzetközi képfelismerési verseny (SeaCLEF) egyik kihívásába neveztünk be, és bálnaegyed felismerési feladatban teszteltem a megoldásomat. Ebben egy nagy címkézetlen képhalmazból kellett képpárokat kiválasztani, amelyek ugyanazt az egyedet tartalmazzák úgy, hogy a felismerést csak a bálnák farokuszonyának mintázata (mely csak adott egyedre jellemző) alapján lehetett megvalósítani. Annak ellenére, hogy felismerést nehezítették a különböző fényviszonyok és a habzó víz, sikerült a versenyben a legjobb eredményt elérni. A megoldásomat aktív tanulás felhasználásával fejlesztettem tovább, melyben egy emberi szakértő segíti a rendszert a csoportok keresésében.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.