Aktív tanulási módszerek a képosztályozásnál

OData támogatás
Konzulens:
Dr. Szűcs Gábor
Távközlési és Médiainformatikai Tanszék

A gépi tanulás és az emberi tanulás összehasonlítása izgalmas téma, melynél párhuzamba állítható a két folyamat. Ezek vizsgálatánál a tanult képek számának függvényében végeztem a képosztályozás pontosságának mérését. A gépi tanuláshoz nagy mennyiségű címkézett tartalomra van szükség, míg az emberi tanulásnál elég néhány, vagy akár egyetlen mintakép egy séma elsajátításához. A két folyamat közti alapvető és egyben legnagyobb különbséget a priori információk eltérő mértéke képezi. Korunk egyik alapvető célja, hogy a gép által elérhető eredményeket maximalizáljuk, így rengeteg emberi erőforrás takarítható meg.

Gépi tanulás esetén, kevés címkézett képnél nagy jelentősége van annak, hogy ezek a tanulás szempontjából mennyire hasznosak. Az aktív tanulásnál lehetőség van a címkézetlen képekből kiválasztani azokat, melyek címkéit a legjobban szeretnénk megkapni, így az a lekérdezés egy iteratív tanulási folyamatot eredményez. A címkézetlen képek lekérdezésére számos stratégia létezik, melyeket intenzív kutatómunka övez és fejlesztés alatt állnak a mai napig.

Munkámnak két fő célja volt, egyszer az emberi és gépi teljesítő képességek összemérése, képi tartalmak osztályozását illetően. Ennek elvégzéséhez egy precíz mérési tervet dolgoztam ki, amely lehetővé teszi az összehasonlítást egyenlő feltételek mellett, amennyiben eltekintünk az emberek tapasztalati tudásától. A másik cél egy aktív tanulórendszer elkészítése volt, melyben egy általam javasolt lekérdezési stratégiát használok. Az eljárás alapját a bizonytalansági mintavételezés képezi, melyet kiegészítek egy eloszlás alapú címkevizsgálattal, így két dimenzió mentén végzem a kiválasztást.

A dolgozatban bemutatom a kidolgozott mérési tervet, az elkészített osztályozó rendszert, melyet elsőként passzív tanulással teszteltem, majd integráltam bele az aktív tanuló modult. Az emberi és gépi tanulás összehasonlítására 5 különböző képhalmazt használtam, melyeket manuálisan gyűjtöttem össze és címkéztem fel. Az eredményeket kiértékeltem és összemértem. Végül a passzív és aktív osztályozó rendszereim szélesebb körű vizsgálata érdekében nagyméretű képhalmazokon (PASCAL VOC2010 és Caltech101) végzett teszteket és azok eredményeit mutatom be.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.