Rekedtség mértékének becslése regressziós eljárással

OData támogatás
Konzulens:
Dr. Vicsi Klára
Távközlési és Médiainformatikai Tanszék

Az elmúlt évtizedekben a patológiás orvostudományi szemlélet mellett kialakult egy preventív szemlélet is, azaz a betegségek kezelése helyett azok kialakulásának megelőzése. A megelőzés mellett a korai diagnosztika is előtérbe került.

A fül-orr-gégészeti szakterületnél is fontos szerepet játszik a megelőzés. Ennek egyik fő megnyilvánulása, a légúti megbetegedések kialakulását erősen elősegítő tényező, a dohányzás elleni kampányok.

Korunk kommunikáció uralta világában különösen fontos a légutak egészsége, a hangképzés normál működése. Amennyiben a hangképzésben, így a kommunikációban valamilyen zavar lép fel, az nem csak magánéletünket, de szakmai pozíciónkat, megélhetésünket is befolyásolja.

Munkám során a BME, TMIT, Beszédakusztikai laboratóriumának, a patológiás elváltozások akusztikai alapú diagnosztizálását célzó projektjén való munkámat folytattam.

A projekt célja, egy folytonos beszédet felhasználó, automatikus, rekedtség súlyosságot meghatározó rendszer létrehozása. Ennek érdekében, a jelen félév célkitűzése, az előző félévben készített regressziós modellek javítása volt. Vizsgáltam a szakemberek értékeléseinek következetességét, különbözőségeit. Új akusztikai paramétereket kerestem a témát érintő legfrissebb cikkek alapján. Ezen paraméterek jel-zaj viszonyt és levegősséget kifejező akusztikai paraméterek, mint a GNE (Glottal to Noise Excitation ratio) variációi, a GQ (Glottis Quotient), és az IMF (Intrinsic Mode Functions)-ből számolt arányok, valamint az olyan nemlineáris paraméterek, mint az RPDE (Recurrence Period Density Entropy), és a DFA (Detrended Fluctuation Analysis). Az új paramétereket, az előző félévhez képest bővített adatbázisból ki is nyertem, és vizsgáltam azok korrelációját, és jóságát a modellépítés szempontjából. A paraméterek vizsgálata során arra a következtetésre jutottam, hogy számos paraméter nem az elvárt trendnek megfelelően veszi fel értékét folyamatos beszéd esetén, viszont a paraméterek egy szűk körének, a rekedtség súlyosságának megállapításában hozzáadott értéke lehet. A bővített paraméterhalmazon végzett paraméter kiválasztással kapott új modellek bíztató eredményeket mutatnak a csupán jitter, shimmer, HNR (Harmonics-to-Noise-Ratio) és mfcc1 akusztikai paramétereket felhasználó modellekhez képest. A klaszterelemzés előzetes eredményei alapján kijelenthető, hogy valószínűleg érdemes férfi és a női hangokat külön kezelni.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.