Mély neuronhálók alkalmazása és optimalizálása magyar nyelvű beszédfelismerési feladatokhoz

OData támogatás
Konzulens:
Dr. Mihajlik Péter
Távközlési és Médiainformatikai Tanszék

Az automatikus gépi felismerés területén jelenleg a legígéretesebb irányt a mély (mesterséges) neurális hálózatokkal megvalósított akusztikus modellek alkalmazása jelenti. Bár teljesítményük lényegesen felülmúlja a hagyományos, generatív akusztikus modellekét, nagyszótáras, magyar nyelvű, folyamatos beszédfelismerési feladatokra való alkalmazásuk terén eddig kevés kutatási eredmény született. A szakdolgozat célja, hogy magyar nyelvű beszédadatbázisok alapján vizsgálja a neurális hálózatos modellek alkalmazási lehetőségeit ipari környezetben megvalósítandó beszédfelismerési feladatokra, elemezze az azokkal elérhető javulást a hagyományos modellekkel szemben és megtalálja az optimális neurálishálózat-architektúrát és paraméter-konfigurációt az egyes feladatokhoz.

Az 1. fejezet bemutatja a beszédfelismerés elméleti hátterét, kitérve a hagyományos megközelítésekre, valamint áttekinti a neurális hálózatok jellemzőit és a velük megvalósítható akusztikus modellezést, végül röviden ismerteti a hasonló feladatokon elért nemzetközi eredményeket. A 2. fejezet specifikálja a keretrendszert, amiben a kísérletek megvalósításra kerülnek. A 3. és 4. fejezetekben két különböző magyar nyelvű beszédfelismerési feladathoz készíthető akusztikus modellek teljesítményének elemezésére kerül sor. Az előbbi feladat televízióban sugárzott hírműsorok alapján készíthető rendszerek vizsgálata, az utóbbi pedig telefonos ügyfélszolgálati adatbázisok alapján rögzített beszélgetéseken alapul. A feladat mindkét esetben minél jobb pontosságú, a hanganyagok automatikus feliratozására, lejegyzésére a gyakorlatban is használható akusztikus modell készítése. Az 5. fejezet összefoglalja a neurális hálózatok tanításának erőforrásigényeit. Végül az eredmények összegzésére és a további kutatási irányok kijelölésére kerül

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.