Mélytanulás generatív párharc hálózatokkal

OData támogatás
Konzulens:
Kahloot Khalid M.M.
Automatizálási és Alkalmazott Informatikai Tanszék

A Generative Adversarial Networks (GAN) a generatív modell lehető legkorszerűbb állapota, különös tekintettel a valósághű képalkotás területén. A legtöbb GAN-eken végzett kutatás a generált képek minőségének javítását helyezi fókuszba. A GAN-ek képesek arra, hogy megtanulják a látens eloszlásokat a képeken nagy adathalmaz megadása esetén. Amint kiderült, nem sok tennivaló van kis adathalmaz esetén, amely következetesen alacsony felbontású képeket eredményez.

Ebben a dolgozatban egy megújító technikát javaslunk a GAN-ekkel való munka során a kis adatbázison fakadó akadályok leküzdésére. A javasolt technikát „okos augmentációnak” nevezik, amely az eredeti adathalmazon pixelkezelést végez, ezen túlmenően pedig kiszűri a rosszul torzított képeket. A mély konvolúciós neurális háló osztályozója arra van képezve, hogy megítélje a végrehajtott augmentáció jóságát. Az okos augmentációs technika legalább négyszeresen képes kiterjeszteni az adatállományoknak méretét, ami viszont nagy hatással van a GAN-ek képalkotására. A DCGAN és a ProGAN felhasználásával különböző adathalmazokon, többek között az MNIST, a „fashion” MNIST, Bob Ross festmények, WikiArt tájképek és a kutyák vs macskák adatbázison okos augmentációt alkalmaztuk. Az okos augmentációnak a ProGAN-nel való eredményei jelentős javulást mutattak a valósághű, kiváló minőségű képalkotásban.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.