Prozódiai szegmentáló kimenetének összevetése szintaktikai elemzéssel

OData támogatás
Konzulens:
Dr. Szaszák György József
Távközlési és Médiainformatikai Tanszék

A prozódiai jellemzők mint a dallam, hangsúlyok, ritmus, szünetek rendkívül fontos szerepet játszanak a beszédben. Ezek adják a beszéd kifejezőerejét, segítik az értelmi tagolást, a beszélő szándékának, érzelmi állapotának meghatározását.

A szintaxis, avagy mondattan, a mondatok szerkezetével, a mondat- és szószerkezet-alkotás szabályaival foglalkozik.

A prozódiai és szintaktikai szerkezet között szoros összefüggés figyelhető meg, még ha egyértelmű megfeleltetést nem is találhatunk a kettő között.

Diplomamunkám célja annak vizsgálata volt, hogy a beszédből kinyerhető prozódiai jellemzők alapján milyen pontossággal és milyen mélységben állítható vissza a szintaktikai szerkezet.

A feldolgozott adatbázis hangfelvételein egy prozódiai szegmentálót futtattam le, valamint ezzel párhuzamosan a felolvasott szövegen automatikus nyelvi elemzést hajtottam végre. A két elemző kimenetének illesztése után lehetővé vált a prozódiai és szintaktikai határok egybeesésének vizsgálata.

Az eredmények azt mutatják, hogy a prozódiai szegmentálásra hagyatkozva három szintaktikai szintet lehet visszaállítani. A legmagasabb szint, a tagmondatok szintje kb. 90%-ban visszaállítható, az alacsonyabb szintek visszaállítási sikeresessége alacsonyabb (65-80%). A szintaktikai szintek elválasztása megvalósítható a prozódiai szegmentáló által meghatározott fonológiai frázisok alapján.

Az eredmények felhasználhatók beszédtechnológiai alkalmazásokban: például beszédfelismerési feladatok pontosabbá tételéhez, automatikus központozás, írásjelezés megvalósítására, automatikus szintaktikai elemzés támogatására.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.