Angol nyelvű beszédfelismerés nyílt forrású alapokon

OData támogatás
Konzulens:
Dr. Mihajlik Péter
Távközlési és Médiainformatikai Tanszék

Az utolsó évtizedben a beszédfelismerés fejlődését nagyban elősegítette a neuronhálók alkalmazása. Az erőforrások folyamatos növekedésével lehetővé vált, hogy az ezen alapuló megoldások hatékonyabbá váljanak elődjeiknél. A beszédfelismerő szoftverek javulása még ma is tart.

Először felvázolom azokat a területeket ahol napjainkban alkalmazzák a beszédfelismerő rendszereket. Az 1. fejezetben a beszédfelismerés folyamatát és történetét foglalom össze. A 2. fejezetben az alkalmazott módszerekről írok. Itt bemutatom az akusztikus modell készítésének a menetét, egészen a hanganyag feldolgozásától kezdve. Kitérek továbbá a nyelvi modell sajátosságaira, illetve a megalkotásához szükséges automatákra is. A 3. fejezet a felhasznált eszközökről, a munkavégzés környezetéről szól. A 4. fejezetben leírom a két elkészített modell jellemzőit. Kiértékelem az eredményeket, és összehasonlítom az ugyanazokkal az adatokkal korábban elért értékekkel is. Végül bemutatom a továbbfejlesztési lehetőségeket és a legfrissebb beszédfelismerőkkel elért eredményeket.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.