Depressziós beszéd akusztikai paramétereinek statisztikus vizsgálata

OData támogatás
Konzulens:
Dr. Vicsi Klára
Távközlési és Médiainformatikai Tanszék

Az emberi beszéd rendkívül összetett jelenség, melyre igen sok tényező hat. Ilyen a beszélő neme, kora, egészségi és érzelmi állapota. Ezeket a tulajdonságokat az ember összetett hallási mechanizmuson keresztül érzékeli. Fontos azonban közelebbről is megvizsgálni a beszédet, mint akusztikai produktumot, hiszen a hangképző szervi megbetegedés, vagy mentális zavarok időben történő felismerése életeket menthet.

Dolgozatomban azt vizsgálom, hogy a depressziós emberek beszédében milyen eltérések tapasztalhatók a normál beszédhez képest. Első lépésként depressziós emberektől származó hangmintákra, majd ezek beszédhang-szintű szegmentálására volt szükség. Az akusztikai méréseket Praat-tal végeztem, majd az így kapott eredményeket a Magyar Referencia Adatbázis (MRBA) hangfelvételeivel vetettem össze. Vizsgálataim középpontjában az alaphang-ingadozás (jitter), amplitúdó-ingadozás (shimmer), a harmonikus-zaj arány (harmonics-to-noise ratio) és mel-frekvenciás spektrális meredekség szerepelt, melyek két magánhangzóra („e” és „a”) terjedtek ki, férfi és női beszélőkre egyaránt.

Statisztikai módszerekkel kimutattam, hogy a depressziós emberektől származó hanganyagokban szignifikáns különbség van. Ezek az eredmények egy később kialakítandó, statisztikai osztályozó eljárás során hasznosak lehetnek, amely azt tűzi ki célul, hogy a beszédből megállapítható legyen: szükséges-e orvosi segítség a páciens gyógyulásához.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.