Spontán jellegű beszéd mesterséges előállítása

OData támogatás
Konzulens:
Dr. Csapó Tamás Gábor
Távközlési és Médiainformatikai Tanszék

Jelen dolgozat betekintést nyújt a spontán jellegű beszéd mesterséges megvalósítására irányuló kutatásaimba és fejlesztéseimbe a magyar nyelvben.

Dolgozatom első részében áttekintem az elmúlt évtizedre jellemző, spontán jellegű beszéd megvalósítására irányuló kutatásokat külföldi viszonylatban. Ennek során három, egymástól elkülönülő, spontán jellegzetességet megvalósító algoritmust mutatok be részletesen.

Ezt követően egy olyan általam készített automatizált módszer megvalósításának az ismertetésére törekszem, ami természetes olvasott beszédből spontán referenciaminták alapján, a dallam és időtartamok szempontjából, spontán jellegű beszédet állít elő.

Egyúttal az olvasó betekintést nyerhet egy prototípus rendszer tervezésébe és kialakításába, amely a Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai tanszéken fejlesztett Profivox szövegfelolvasó rendszer kiegészítésével, spontán jellegű szintetizált beszédet állít elő dallam és időtartam szempontjából, megfelelő spontán referenciaminták rendelkezésre állása esetén.

Végezetül, hogy az átalakítások sikerességét szubjektíven le lehessen ellenőrizni, egy meghallgatásos teszt környezetét, valamint a hallgatók által adott válaszok eredményét és értékelését közlöm.

A dolgozatban bemutatott eredmények továbbfejlesztésével spontán jellegű beszéd szintetizálására alkalmas szövegfelolvasó rendszert lehet megvalósítani, amely ezután felhasználható online nyelvoktatásban, spontán beszédfelismerő rendszer fejlesztésénél, valamint olyan alkalmazásokban, ahol fontos a természetesebb ember-gép interakció.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.