Beszéd automatikus detektálása és frázis szintű szegmentálása spontán beszédben

OData támogatás
Konzulens:
Dr. Vicsi Klára
Távközlési és Médiainformatikai Tanszék

A Beszédakusztikai Laboratóriumban készített diplomatervem elsődleges célja a beszéddetektáló rendszerek ismertetése. A beszéddetektálás gyakran a beszédfelismerő rendszerek szerves része, ám az én témám konkrétan az érzelemfelismerők fejlesztéséhez kapcsolódik, ahol nem a szöveg pontos felismerése a feladat, inkább az egyes mondatrészek, frázisok detektálása, valamint elkülönítése a zajoktól, amely megkönnyíti az érzelemfelismerők működését.

A terv során a feladatom az alábbi részekből áll: mai érzelem- és beszéddetektálással kapcsolatos kutatások megismerése, alkalmazása, összehasonlítása, valamint az eredmények kiértékelése. A beszéddetektáló rendszerek megismerésekor az utóbbi időben kifejlesztésre került, jelenleg is használatban levő rendszerek áttekintése a célom.

A későbbi feladatok előkészítését jelenti a laborban korábban gyűjtött telefonos mintaadatbázis ellenőrzése és javítása annotációs program segítségével. A detektálók gyakorlati alkalmazása esetemben a Hidden Markov Model Toolkit nem valós idejű rendszer valamint az Emotion Recognition Application, jelenleg a fejlesztés korai szakaszában járó, valós idejű beszédfelismerő használatát jelenti, melyek alapjául a korábban javított adatbázis szolgál.

A Beszédakusztikai Laboratóriumban jelenleg is használatban levő detektáló rendszerek összehasonlítását úgy valósítom meg, hogy mindkét detektálót azonos hanganyagot felhasználva a kézi detektálással hasonlítom össze.

A laborban jelenleg is használatban levő értékelő rendszer korábban már többféle felismerési feladathoz adott összehasonlító számadatokat. Feladataim közé tartozik egy, a témámhoz legjobban illeszkedő értékelő rendszer megtervezése és megvalósítása, amely a detektálási tesztek során a segítségemre lehet. Az értékelővel szemben két fontos elvárást támasztottam, az egyik az egy programbeli megvalósítás, a másik az egyetlen százalékértéket tartalmazó eredmény.

A záró gondolat a beszéddetektálás és érzelemfelismerés jövőbeli lehetőségeiről szól.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.