Szemantikus technológiák alkalmazása adattárházak tervezésére és megvalósítására

OData támogatás
Konzulens:
Dr. Gajdos Sándor
Távközlési és Médiainformatikai Tanszék

Az adatelemzés napjaink egyik leglényegesebb és legjobban fejlődő területe az informatikában. Az adattárházak mint integrált és historizált adatbázisok a szervezeti analitikai infrastruktúrák alapvető elemei. Mivel az adatforrások szemantikailag és technikailag egyaránt egyre heterogénebbek, az adatok integrációja egyre nehezebb feladatot jelent. Annak ellenére, hogy az adattárház fejlesztési módszerek már kiforrottak, eleddig kevés próbálkozás mutatkozott a fejlesztési folyamat egyes lépéseinek - legalábbis részleges- automatizálására.

A különböző szervezetek egyik jelentős leküzdendő feladata napjainkban a tudásmenedzsment rendszerek kiépítése vagy magasabb szintre elemése. Bár egy szervezet egyik legnagyobb értéke a szervezeti tudás, sok helyütt szembesülhetünk a tudás informális módszerekkel való menedzsmentjével, de számos esetben még azzal sem. A gyakorlat azt mutatja, hogy a tudásmenedzsmentnek az adattárház projektekben is nagy szerepe lehet, ugyanis az üzleti szakértők és a fejlesztők közötti tudástranszfer, illetve a szemantikus integráció sok erőforrást igényel.

A diplomatervem keretein belül megvalósított rendszer az előbb említett két probléma megoldására jött létre. Egy olyan rendszert terveztem és fejlesztettem, amely egy adott üzleti terület és a szükséges technikai adatok formális szemantikus leírására alapozva lehetővé teszi egy adattárház normalizált részletes adattárának adatmodelljének automatizált létrehozását, illetve a létrehozott adatstruktúrákhoz tartozó betöltő és transzformációs tárolt eljárások megfelelő felparaméterezését. Az üzleti terület és a technikai adatok leírását OWL ontológiákban valósítottam meg, amelyek akár közvetlenül, akár egy nagyobb rendszer részeként alkalmazhatók a szervezeti tudásmenedzsment megalapozására vagy fejlesztésére; illetve - ahogy a diplomatervben is megmutatom - felhasználhatók az adattárház fejlesztési folyamat által igényelt erőforrások csökkentésére. A diplomatervem kereteit a dozimetriai szakterület adta, amely az ionizációs sugárzás emberekre és a környezetre gyakorolt hatásával foglalkozik.

A diplomaterv első részében bemutatom az Inmon által definiált adattárház architektúrát, illetve összehasonlítom Kimball és Linstedt elképzeléseivel. Ezt követően ismertetem a leglényegesebb szemantikus formalizmusokat, illetve bemutatok néhány példát a szemantikus technológiák analitikus rendszerekben való alkalmazására.

A diplomaterv második részében az elkészített rendszer terveit és fejlesztését mutatom be, tekintettel a legfontosabb algoritmusokra, technikákra, az üzleti terület és a technikai adatok szemantikus alapú formalizálásra, illetve a rendszert implementáló ontológiákra, csomagokra és osztályokra. Végül értékelem és összefoglalom a munkámat, illetve bemutatom a rendszer további fejlesztésének lehetőségeit.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.