Tanulórendszerek adathiányos környezetben

OData támogatás
Konzulens:
Hadházi Dániel
Méréstechnika és Információs Rendszerek Tanszék

Jelenlegi tanuló rendszerek közelmúltban történt áttöréseknek köszönhetően képesek akár

emberi teljesítményt is túlszárnyalni több területen úgy mint képfeldolgozás, természetes

nyelvi feldolgozás és hangfeldolgozás területén is. Azonban ehhez rengeteg tanulóadatra

és hatalmas számítási erőforrásokra van szükség. A diplomamunkám végső célja olyan

tanuló rendszer megalkotása, amely hatékonyan képes felhasználni a tanulóadatokat. A

hatékonyságot a tanulóadatok darabszámában definiálja a szerző. A probléma többféle

megközelítésből is meg lehet vizsgálni, jelen műben két megoldást tárgyal a szerző: oneshot

learning és az active learning irányt mutatja be ez a diplomamunka.

A dolgozat első felében olyan architektúra kialakítását vizsgálom, amely kevés adat

felhasználásával képes minimális pontosság veszteség mellett osztályozni. A one-shot learning

feladatot vizsgálom és erre optimalizálom a tanulórendszert. A feladat folyamán egy

osztályból pontosan egy mintapontot használhat az eljárás tanulásra. Ezzel a kényszerrel

a probléma az adatpont megfelelő tulajdonság kiemelése irányába lett eltolva. A feladat

során ezeket a tulajdonságokat is tanulja a rendszer más hasonló karakterisztikával rendelkező

adatokból.

A második fele a diplomamunkának az adatgyűjtés problémáját próbálja optimalizálni

olyan módon, hogy minél értékesebb adatokat gyűjtsön. Értékesebb adatnak minősíthető

egy adatpont, ha a döntést jobban meghatározza, mint egy másik minta. Ez a problémakör

az active learning témakörébe tartozik. A diplomaterv során olyan szituciót vizsgálok,

melyben az adatgenerátor elérhető és a kívánt minta tulajdonságai állíthatóak. Ezt a

problémát egy példán kersztül mutatja be a fejezet, amelyben beszélőfelismerés a feladat

és az adatgenerátorok a felismerni kívánt személyek. Egy adatpontnak tekinthető egy

kimondott szó tekinthető. A kimondott szó úgy szabályozható, hogy meghatározható,

hogy kitől szeretne a rendszer mintát venni, a másik amit lehet szabályozni, a szót magát.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.