Tudásalapú szövegelemző-rendszer fejlesztése

OData támogatás
Konzulens:
Dr. Mészáros Tamás Csaba
Méréstechnika és Információs Rendszerek Tanszék

Manapság egyre szélesebb körben használnak számítógépes adatelemzési eszközöket, amik új kihívásokat jelentenek az informatika világában. Munkám során két aspektusra helyezek hangsúlyt, melyek napjainkban egyre relevánsabbak. Egyrészt a szövegelemző- illetve kereső rendszerek hatékonysága sok területen nem teljesíti az elvárásokat, másrészt a felhasználók jelentős része nem rendelkezik mélyebb informatikai ismerettel, ami sokszor az említett eszközök használatához szükséges lenne. Ilyen alkalmazási terü-letek például a természettudományok és a bölcsészet, ahol a rendelkezésre álló adatok minősége sokszor nem megfelelő a jelenleg elterjedt eszközök számára.

Dolgozatomban a problémák megoldására a szakterületi tudás jobb kiaknázásával teszek javaslatot, ennek keretében egy tudásalapú szövegelemző-rendszert fejlesztettem, amely rendelkezik egy természetes nyelvű interfésszel is.

A rendszer lehetővé teszi a betöltött szövegek tudásalapú feldolgozását, amelynek a megvalósításához szükséges szemantikus információt RDF formátumban tárolja. A dol-gozatom során megmutatom, hogy a klasszikus kulcsszó alapú kereséssel szemben ez a módszer jobb pontosságú találatokat eredményez, valamint a szövegelemzési és más hagyományos stilometriai műveletek során is jobb eredményeket ér el.

A rendszer másik előnye a természetes nyelvi interfész, amely lefordítja a lekérdezéseket a rendszer által feldolgozható belső parancsokra. Ez megkönnyíti azok munkáját, akik nem rendelkeznek programozási ismeretekkel. Munkám során példaként a szövegelem-ző-rendszerhez az irodalmárok által használt stilisztikai eszközöket nyújtó felületet valósítottam meg.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.