Járművek képi felismerése mély tanulási módszerekkel

OData támogatás
Konzulens:
Kundra László János
Automatizálási és Alkalmazott Informatikai Tanszék

A képfeldolgozás területén az objektumok detektálása, valamint nyomon követése a mai napig központi téma, és habár egyre hatékonyabb eszközeink vannak, nem rendelkezünk a problémára egzakt megoldással. A legnagyobb áttörést napjainkban a mély neurális hálók a számítástechnika fejlődésével együtt hozták meg. A természetből ellesett ötlet az agyi kapcsolatok modellezésére épül, az állatvilágban használt képi feldolgozást próbálja meg utánozni. Munkámban elsősorban a járművek optikai felismerésére fogok koncentrálni, az általánosságtól a konkrét megoldásig haladva, először mint a gépi tanulás részeként elemezve történelmi áttekintéssel együtt. A feladat a neurális háló struktúrájának kitalálása a probléma bonyolultságának megfelelően, majd a tanítóminták (jelen esetben az egyes képek a hozzájuk tartozó címkével) segítségével annak feltanítása. Kitérek a leginkább használt költségfüggvényre (cross entropy) és a hozzá tartozó regularizációs tagokra (L1, L2), a gradiens alapú optimum kereső algoritmusokra és az ehhez szükséges backpropagation algoritmusra. Szó lesz a bias-variancia problémáról és a lehetséges megoldásokról (például dropout) valamint hibakereső eljárásokról. A megkívánt számítási kapacitás hiányában már betanított hálókat fogok alapul venni a struktúrájukat kielemezve, és ezek csak egy részén fogom elvégezni a tanító algoritmusokat. A feladat megoldásán az elméleti háttérre nagy hangsúlyt fektetve fogunk végighaladni az egyes szoftvercsomagok bemutatásával együtt. Végül pedig az elkészült hálót minőségi szempontból értékelem egy teszthalmazon.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.