Szinuszos kódoló alkalmazása beszédszintézishez

OData támogatás
Konzulens:
Dr. Csapó Tamás Gábor
Távközlési és Médiainformatikai Tanszék

A dolgozatomban a vokóderek egy fajtájával, a szinuszos kódolással foglalkozom, és azt beszédjelekre alkalmazom. Szinuszos kódolás során a beszédjelekből olyan paraméterek nyerhetők ki, amelyek a beszédhangot alkotó szinuszos komponensekre jellemzők. Ezekből aztán egy szintézis során újra előállítható az eredeti beszédhangra nagyon hasonló szintetizált beszédhang.

Először ismertetem a szinuszos kódolás alapjait. Munkám első lépése a kutatás, ennek kapcsán betekintést nyújtok a szinuszos kódolók működésébe. Ezután bemutatom, hogy én hogyan tervezek és valósítok meg a szerzett ismeretek alapján egy egyszerű szinuszos beszédkódolót. Ez képes a beszédjel szinuszos komponenseiből amplitúdó és frekvenciaparamétereket kinyerni, majd ezek alapján szintetizálni a beszédhangot.

Egy létező szinuszos kódoló implementációt is megvizsgálok közelebbről, és ezt is bemutatom. Egyúttal rávilágítok egy gyenge pontjára, ami az irreguláris zöngék kezelésekor lép fel. Kísérletet teszek ennek javítására egy korábbi modell illesztésével.

A megvalósított módszereket szubjektív véleményekkel, egy meghallgatásos teszt során értékelem. Miután néhány ember kitölti a tesztet, jobb rálátást kapok a minőségről, és kiderül, hogy a javított megoldás jobban teljesít.

Az általam elkészített szinuszos kódoló további kiegészítésekkel jelentősen feljavítható a jövőben, ami alkalmazhatóvá teheti a beszédjel-feldolgozás bizonyos területein (pl. beszédszintézis, beszéd transzformáció).

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.