Mesterséges neurális hálózatok fejlesztése TensorFlow alapon

OData támogatás
Konzulens:
Dr. Strausz György
Méréstechnika és Információs Rendszerek Tanszék

A szakdolgozatomnak két súlypontja volt, az egyik hogy elmélyítsem a tudásomat a mesterséges neurális architektúrák területén elméleti síkon, a másik hogy elsajátítsam a Tensorflow - ami egy elosztott, gráf alapú numerikus könyvtár a Googletől - ökoszisztémájának kezelését az előbb említett hálózatok programozásán keresztül. Mivel ez mindenféle keret nélkül hatalmas témakör lenne, ezért a dolgozat fókuszául a képosztályozást választottam.

A szakdolgozat először is arra a kérdésre próbál meg röviden választ adni hogy miért kell még ma is effektív tudással rendelkeznie az embernek a hálók működéséről ahhoz hogy valóban komplex rendszerekben használni tudja őket, még akkor is ha az eddig elkészült architektúrák nagy része sokszor előre elkészítve, sőt akár bizonyos feladatokra előre tanítva is elérhető. Ezután egy rövid történelmi összefoglalóval teszem kontextusba a dolgozat témakörét.

A dolgozat irodalom kutatással foglalkozó részében a tensorflow ökoszisztémáját, és a mesterséges neurális hálózatokkal való képosztályozás elméletét tekintem át, véleményem szerint az összes fő témakört érintve. Ezek sorrendben az előtanulás nélküli többrétegű perceptronok, az előtanított többrétegű perceptronok, a konvoluciós hálózatok, és a hibrid architektúrák. A hibrid architektúrákon belül kitérek két megközelítésre is. Az első amikor egy generatív architektúrát kombinálunk egy teljesen külön álló diszkriminatív osztályzóval, esetemben egy korlátozott boltzmann gépet egy szupport vektor géppel. A második amikor maga a neurális architektúra hibrid, tehát egyben modellben ötvözi a generatív és a diszkriminatív megközelítést. Ez a hibrid korlátozott boltzmann gépek megközelítése ami egy igen új fejlemény. Ezek után ismertetem a terület egy-két számomra izgalmas és új fejleményét.

A kísérleti részben az előbbiekben leírt elméleti részből kísérletezem számos architektúrával az MNIST és a CIFAR-10 adathalmazokon. Itt inkább előtérbe helyezem az egyes architektúrákat, és a hálózatok futás idejű karakterszitikáit, és elhanyagolom az olyan témaköröket mint a bemeneti adatok előfeldolgozása, a tanítás korai megállítása vagy a hiperparaméter térben való effektív keresés és ezek kombinációinak a (kereszt)-validációja. Az előbb említett pontok természetesen egy valós ipari környezetben nagy jelentőséggel bírnának, de egyenként is érdemesek lennének akár egy egész TDK, szakdolgozat vagy diploma témának. De sajnos elvennék a fókuszt attól amivel foglalkozni szerettem volna, nevezetesen a különböző modellekkel való kísérletezéstől.

A dolgozatot az előbbi fejezetekből levont tanulságokkal zárom.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.