Nemlineáris paraméterek hatásának vizsgálata patológiás és egészséges beszéd osztályozására

OData támogatás
Konzulens:
Dr. Vicsi Klára
Távközlési és Médiainformatikai Tanszék

A szakdolgozatom célja, hogy elősegítse a megfelelő paraméterhalmaz megtalálását egy hatékony osztályozó modell alkotására. Az osztályozó modell célja, hogy folytonos beszéd esetén egy-egy páciensről megállapítható legyen, hogy szenved-e valamilyen gégészeti elváltozásban vagy sem. Rendelkezésemre állt egy egészséges és patológiás hangfelvételeket tartalmazó adatbázis, amit jómagam is bővítettem. A beszéd minőségét foniáter szakorvos határozta meg az RBH kód szerint, amely egy szubjektív rekedtségi skála. Összesen 148 egészséges és 222 patológiás hangfelvétellel dolgoztam.

Az előfeldolgozás folyamán a felvételekből kinyerésre kerültek az ’E’ hangok, melyekből 20 különböző akusztikai paramétert nyertem ki, felvételenként átlagoltam az egyes értékeket, így felvételenként egy 20 elemű vektor állt rendelkezésemre. Az akusztikai paramétereket klasszikus, nemlineáris és modern csoportokba soroltam. Mann-Whitney u-próbát végeztem egészséges és patológiás csoportok között, külön vizsgálva a nők és a férfiak hangját is. Bár több esetben is szignifikáns különbség mutatkozott az egészséges és patológiás csoportok között az akusztikai paraméterek mentén, a kapott átlagértékek nem a vártnak megfelelően alakultak. A paraméterek osztályozásra gyakorolt hatásának kiderítése érdekében SVM osztályozást végeztem. E művelet során több variációt is kipróbáltam, négyféle paraméterkiválasztási eljárást is használtam, illetve lineáris és RBF kernel használatával is megnéztem mind a négyféle kiválasztási módon kapott paramétercsoportot. A legjobb eredmény nők esetében 88%, férfiaknál 87%, míg mikor az összes felvétel felhasználásra került 84% volt. Az utóbbi esetben a paraméterkiválasztási eljárás által kiválasztott akusztikai paraméterek a jitter_ddp, shimmer_apq3C, mean_hnrC, mfcc01, GQ->std_cycle_closed, GNE->SNR_TKEO, GNE->NSR_TKEO voltak.

Megállapítható, hogy a nemlineáris és modern akusztikai paraméterek működése folyamatos beszédben eltér az irodalomban feltűntetett, kitartott hangokra kapott tendenciáktól. Az osztályozási eredmények alapján viszont arra lehet következtetni, hogy javíthatják az osztályozás pontosságát, ha a klasszikus akusztikai paraméterekkel együtt használjuk. Ez a kérdéskör további, alaposabb vizsgálatra szorul.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.