Beszéd átiratának automatikus írásjelezése prozódiai információk alapján

OData támogatás
Konzulens:
Dr. Szaszák György József
Távközlési és Médiainformatikai Tanszék

A beszédben előforduló prozódiai tényezők, úgy mint hangsúly, a hanglejtés stb. releváns információtartalommal rendelkeznek. Mivel a prozódia ezen jellemzői, valamint a nyelvi tényezők (pl. szintaxis) fontos szerepet játszanak a folyamatos beszéd tagolásában, ezért a 21. század kezdetétől egyre több kutatás indult azzal kapcsolatban, hogyan lehetne a beszédfelismerőket kiterjeszteni automata írásjelezéssel. Bár a jelenleg használt beszédfelismerők csak részben, vagy egyáltalán nincsenek erre felkészülve, a beszédfelismerők kimenetének értelmezésében zavaró az írásjelek hiánya, illetve más típusú feladatok – nyelvi elemzés – esetén is gondot jelent az „írásjelezetlenség”.

Ezen a területen a fonológiai frázisokkal való megközelítés szempontjából még nem született megoldás magyar nyelvre, így szakdolgozatomban az automata írásjelezés kezdeti lépéseit tudom megtenni.

Feladatkörömbe tartozott az ehhez kapcsolódó elméleti háttér áttekintése, egy HMM (rejtett Markov-modell) alapú rendszer prozódiai szegmentlásra való betanítása, az automata szegmentálás kiértékelése a Precision-Recall metrikák szerint, majd a szegmentáló kimenete és az írásjelezett szöveg összevetése különböző statisztikai vizsgálatok alapján, melyben az írásjelek előtti és utáni frázisokkal való kapcsolatokat vetettem össze.

Ennek alapján javaslatokat adok a beszédfelismerő kimenetének automatikus írásjelezésére, illetve arra, hogy mely területeken lehet tovább fejleszteni, illetve beilleszteni kapott eredményeimet.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.