Mély autoencoderek és konvolúciós neuronhálók a gyakorlati képosztályozásban

OData támogatás
Konzulens:
Dr. Gyires-Tóth Bálint Pál
Távközlési és Médiainformatikai Tanszék

A szakdolgozatom két fő részből áll: az első rész a mély neurális hálózat alapú felügyelt tanítással foglalkozik, míg a második rész a felügyelet nélküli tanítással. A felügyelt tanítás jelenleg aktívabban kutatott ága a mély neurális hálózatoknak a felügyelet nélküli tanításhoz képest, ezért az utóbbit elsősorban elméleti vonatkozásban közelítem meg.

A felügyelt tanítással foglalkozó részben kártékony növények automatikus felismerésére és azonosítására alkalmas mély konvolúciós neurális hálózatok létrehozásával foglalkoztam. E kártékony fajok irtása mind gazdasági, mind egészségügyi szempontból fontos feladat, hiszen természetes ellenség hiányában gyorsan elterjednek veszélyeztetve az adott terület őshonos élővilágát, illetve - például allergén fajok esetén - az emberi egészséget is.

A kutatásom e része mély konvolúciós neurális hálózatokon alapul. Az elmúlt évtizedben a gépi képfelismerésnek és képosztályozásnak egyik meghatározó technikájává váltak a mély konvolúciós neuronhálók. A grafikus processzorok (Graphical Processing Unit, GPU) ugrásszerű fejlődése, a sok digitális adat és az új tudományos eredmények lehetővé tették, hogy napjainkra a konvolúciós neurális hálózatok akár még az embernél is jobb eredményeket érjenek el a képek felismerésében.

Dolgozatomban megvizsgálom a különböző képfelismerő architektúrák elméleti hátterét és kiválasztom az általam a célnak legmegfelelőbbnek ítélt módszereket. A kutatás során 3 különböző típusú, a nemzetközi szakirodalom szerint nagy pontosságú és széles körben használt konvolúciós neurális hálózatot használok. A neuronhálókat vagy az alapoktól kezdve tanítom, vagy pedig más képekkel előretanított modelleket használok, és ezeket tanítom tovább új klasszifikációs rétegekkel. A tanítást két eltérő teljesítményű GPU-ra optimalizálom.

Az eredményeket mindegyik konvolúciós hálózat esetén két különböző metrikával értékelem ki: pontosság (accuracy) és MAP (Mean Average Precision). Eddigi munkám eredményeként mintegy 70%-os pontossággal meg tudom állapítani, hogy kártékony növény van-e a tesztadatbázis képein.

Dolgozatom második része a felügyelet nélküli tanítással foglalkozik, azon belül is az autoencoderek alapvető felépítésével és használatával. A felügyelet nélküli tanítás azt jelenti, hogy címkézetlenek az adatok, azaz például képek esetén nincs megadva a kép osztálya. Kutatásom elsődleges célja az autoencoderek megismerése. A megszerzett tudást címkézetlen képek szétválogatásán próbálom ki többféle módszerrel, több típusú autoencoderrel. A megoldás hatékonyságát címkézett képekkel visszamérem.

Munkám második részében végül a felügyelet nélküli tanítással nem tudtam megoldani a képek szétválogatását, viszont külön, osztályonként betanított autoencoderekkel sikerült. Ez a megközelítés azonban nem tekinthető felügyelet nélküli tanításnak, mert az osztályonkénti betanításhoz ismernünk kell a képek osztályát. Mindazonáltal, az általam kipróbált eljárások és a kidolgozott megközelítés hasznos lehet a téma további kutatása során.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.