Szemantikai elemzés gráf-transzformációkkal

OData támogatás
Konzulens:
Recski Gábor András
Automatizálási és Alkalmazott Informatikai Tanszék

A természetes nyelvfeldolgozás a gépi tanulás egy olyan ága, ami természetes nyelv számítógéppel való feldolgozásához

elengedhetetlen eszközöket nyújt, és a modern világunkban egyre inkább elterjedté válik a gép és az emberek közötti

természetes nyelven történõ kommunikációra. Ennek megvalósításához van szükségünk a szöveg tartalmi elemzésére.

A szemantikai elemzés (semantic parsing) célja, hogy nyers szöveges adathoz automatikusan

készíthessünk szemantikai reprezentációt, azaz modellezzük a szöveg jelentését. Ha a nyelvi

jelentést fogalmak irányított gráfjaival reprezentáljuk, ezeket pedig a mondat szintaktikai

szerkezetét reprezentáló fákból kell elõállítanunk, akkor a teljes feladat egyetlen komplex gráf-transzformációként

definiálható.

Egy-egy ilyen elemzõ teljesítménye közvetlenül nem, csak konkrét technológiákon keresztül

értékelhetõ, ilyen például a gépi szövegértés (Machine Comprehension), vagy a természetes nyelvi következtetés (Natural Language Inference)

, illetve tudásbázis populáció (Knowledge Base Population). A mély szemantikai elemzés elkerülhetetlen része a lexikális következtetés (lexical inference),

melynek során egy-egy szó jelentésének reprezentációjából kiindulva próbáljuk bõvíteni az egy egész frázis vagy mondat jelentését reprezentáló gráfot.

A diplomaterv témája az elõbb említett feladatok megoldása a szemantika elemzõ 4lang (Recski et al. 2016) rendszer segítségével, illetve ennek bõvítése

megfelelõ inferenciát megvalósító szabályokkal és a gráfok felett értelmezett metrikákkal. A dolgozat magába fogalja a 4lang rendszer lehetõségeinek

REST API-t megvalósító mikroszolgáltatásokba való csomagolását is.

Elõzetes eredményeink azt mutatják, hogy

a gépi szövegértés feladatonk kidolgozott rendszerünk beépítése 2018-ban bemutatott state-of-the art rendszerbe \cite{Wang:2018} 0.5 százalék javulást hoznak.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.