Zenei stílustranszfer mesterséges neurális hálózattal

OData támogatás
Konzulens:
Dr. Pataki Béla József
Méréstechnika és Információs Rendszerek Tanszék

Manapság a mesterséges intelligencia egyik leggyorsabban fejlődő és legnépszerűbb irányzata az úgynevezett deep learning vagy mély tanulás. Köszönheti ezt egyrészt a gyorsan bővülő hardveres erőforrásoknak, melyek lehetővé teszik az egyre nagyobb számítás- és memóriaigényes feladatok reális időn belüli elvégzését, másrészt különböző elméleti és gyakorlati ötleteknek, áttöréseknek. Ezek közül az egyik legjelentősebb a konvolúciós hálók újrafelfedezése, melyek sokkal kevesebb paraméterrel képesek egy bonyolult problémát leírni.

Másik fontos tulajdonságuk, hogy bizonyos osztályozási problémák esetén konvolúciós, majd teljesen összekötött rétegekből felépített háló konvolúciós része képes a tanulás folyamán önállóan a problémára jellemző tulajdonságokat kialakítani (feature selection). Ez a jelenség alkalmassá teszi ezen hálókat bonyolult adatstruktúrák jellemzőinek felismerésére és kvantálására, melyet egy kép vagy zene esetén stílusnak hívunk.

Ezen osztályozó hálókat több alkalmazásban felhasználták arra, hogy egy kép ‘stílusát’ módosítsák, és egy másikéhoz tegyék hasonlóvá. Számos eredmény született már ezen a területen, azonban a stílustranszfer minőségét eddig csupán szubjektív érzet alapján értékelték.

Szakdolgozatomban bemutatom a zene stílustranszferhez szükséges technológiákat, majd megvalósítom magát a stílustranszfert és értékelem azt két új, saját metrika szerint. Ehhez megvalósítottam egy zene osztályozására képes konvolúciós hálót, melynek paramétereit genetikus algoritmus segítségével optimalizáltam. A további paraméterek optimalizálásához kimerítő keresést vettem segítségül.

A zene osztályozás pontosságában jelentős növekedést sikerült elérnem a genetikus algoritmus felhasználásával, míg a stílustranszfer és az objektív metrika bíztató eredményeket nyújtott. Az itt ismertetett metodológia más, gépi tanulást igénylő probléma esetén is hasznos lehet.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.