Modell alapú adatelőkészités kiértékeléshez

OData támogatás
Konzulens:
Dr. Pataricza András
Méréstechnika és Információs Rendszerek Tanszék

Szakdolgozatomban arra kerestem megoldást, hogyan lehet egyszerűsíteni, gyorsítani, automatizálni a mérési adatok feldolgozásának folyamatát.

A feladat a leggyakoribb és leginkább időigényes problémát, a hibás vagy hiányos adatok felismerését, és kezelését ragadja meg. Ez szokásosan az adatelemzésre fordított feldolgozási idő közel 80%-kát veszi igénybe.

Az adatok szintaktikai ellenőrzése ugyan könnyen automatizálható, de a formailag helyes, azonban tartalmilag hibás adatok felismerése gyakran külső tudást is igényel.

Ennek bevitele az ellenőrzési folyamat automatizálásába különösen nagyméretű adatsorok esetén kritikus. Az automatizálás azt igényli, hogy az adatokról szóló szemantikus információt illetve magukat az adatokat egy egységesen, gépi módon kezelhető formába hozzuk.

Lehetséges megoldásként felmerül a szemantikai információ ontológiában való ábrázolása és annak harmonizálása a mért adatokat tartalmazó adatbázissal. Számos előnye van az ontológiában definiált tudás adatbázisba történő reprezentálásának. Nincs adatvesztés, a hierarchia, a kapcsolatok teljes mértékben leképezhetőek, valamint lehetőség van származtatott adatok kezelésére is.

Az ontológia és az adatbázisbeli adatok összekapcsolása során meg kell valósítani a tipikus adatbáziskezelő műveleteknek (keresés, kiválasztás, módosítás) egy olyan verzióját, amelyet az ontológia tartalma vezérel.

Ahhoz, hogy az ontológiát fel lehessen használni adatbázisbeli mért adatok tisztítására, a fenti, a kettőt összekapcsoló környezet felett kell létrehozni a speciális műveletsort.

Ez a kapcsolat egy újabb adatbázis, amely szűrőként funkcionál, eredménye pedig az ellenőrzési folyamat során elsőként az elődiagnosztizált rossz adatok listája, majd a javítás után a tisztított mérési adatok.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.