Kontrollált természetes nyelvű szövegannotáló-rendszer

OData támogatás
Konzulens:
Dr. Mészáros Tamás Csaba
Méréstechnika és Információs Rendszerek Tanszék

A szakdolgozatom témája egy szövegannotáló rendszer megtervezése és megvalósítása volt, melynek művekre vonatkozó jegyzetei természetes nyelven íródnak, és amelyekből a rendszer tudáskinyerésre, tudásbázis építésére képes a felannotált művekre vonatkozóan.

Ennek fényében a munkám gyümölcse egy olyan alkalmazás, melynek segítségével a felhasználó az általa kiválasztott szövegeket a rendszer rendelkezésére tudja bocsátani, majd ezen szövegeket ellátni kritikai jegyzetekkel, melyeket természetes~--~emberi kommunikációra szabott~--~nyelven fogalmazhat meg. A rendszer ezen jegyzetekből gép által értelmezhető tudást nyer ki, amelyet egy tudásbázisban tárol. A tudásbázis a kinyert tudást alapjául tekintő következtetési folyamatra is képes, ezáltal a bevitt tudáson felül az abból logika útján következő állítások is a rendelkezésre álló tudás részét képezik. A felhasználónak lehetősége van arra, hogy kérdéseket tegyen fel és ezeket is természetes nyelven fogalmazhatja meg. Ezáltal a felannotált művekre vonatkozó tudáshoz tud jutni, ami a rendszer legfeltűnőbb haszna és újdonsága.

Ennek a megvalósításához számos részfeladatot meg kellett oldanom. Első ízben megterveztem a rendszer architektúráját, aminek eredményeképpen helyet kaptak a rendszer komponensei, valamint a közöttük lévő kapcsolatok. Ezek után a nyelvtani elemzés folyamatát terveztem meg és az ehhez szükséges előfeltételeket is megteremtettem: a mondatok helyességét nyelvtani szabályhalmazokkal szabályoztam, ahol a szabályhalmazoknak is meg kellett felelniük egy szülőszabálynak, hogy az értelmező egységesen kezelhesse őket. A szabályhalmazok írják elő a mondatok tudásra való lefordításának módját is. Ezek után megvalósítottam az elemzőt egy ismert algoritmus alapján, kibővítve saját módosításokkal, hogy a tudáskinyerés feladatát el tudja végezni. Az elemző által kinyert tudást osztottan tároltam el: az entitásokat~--~szövegeket, jegyzeteket, szabályokat~--~egy adatbázisban, míg a rájuk vonatkozó állításokat a tudásbázisban. Ezeket a funkciókat egy szerveralkalmazásba ágyaztam bele, mely egy népszerű módszerrel teszi elérhetővé őket.

Ehhez a felhasználói felület egy webalkalmazás formájában készült el, amely az entitások kezelését teszi lehetővé a felhasználó számára, vagyis ezek olvasását, alkotását, módosítását és törlését, valamint a szövegekből és annotációkból kinyert tudás lekérdezését.

A megvalósított részfeladatok működését illusztrálom az írásmű releváns pontjain. Ehhez valós életbeli példákat ültettem át a rendszeremre, nevezetesen Mikes Kelemen Törökországi leveleit és Hopp Lajos hozzájuk fűzött kritikai jegyzeteit, amihez néhány nyelvtani szabályhalmazt terveztem meg. Ezek alkalmasak arra, hogy rajtuk keresztül bemutassam a szöveg információtartalmának lefordítását tudásreprezentációra. Ezeken kívül a dolgozat kitér a rendszer továbbfejlesztési lehetőségeire is.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.