Nem strukturált adatok elemzése

OData támogatás
Konzulens:
Dr. Gajdos Sándor
Távközlési és Médiainformatikai Tanszék

Manapság az informatikai rendszerekben szereplő információ nagy része szöveges-, kép, hang-, illetve videó fájlokban található meg. Az említett források hatékony feldolgozása hosszú ideig elképzelhetetlen volt pusztán gépi rendszerekre támaszkodva, amely komoly emberi munkaerő bevonását követelte – ezzel próbál szakítani a Hewlett-Packard által fejlesztett Autonomy termékcsalád.

Szakdolgozatom három fő részre bontható. Az első részben a nem strukturált adatok elemzésének területét mutatom be. A második részben az Autonomy nyújtotta lehetőségeket kiaknázva tervezek és valósítok meg egy mobil telekommunikációs trendek elemzésére alkalmas megoldást, míg a harmadik részben egy felhasználói felületet tervezek és valósítok meg, amely az elemzés során előálló eredmények bemutatására alkalmas.

Mindkét fejlesztési feladatot a vízesésmodellben szereplő életciklusokon viszem keresztül, mivel ezt a modellt találtam a feladathoz leginkább illeszkedőnek. A modellnek megfelelően minden esetben a specifikáció és a követelmények meghatározásával kezdem a munkát, amit a rendszer átfogó architektúrájának, illetve a felhasználók interakcióinak ismertetése követ. Az ezt követő részletes tervezés három fő egységre bontható. Először meghatározom az elkészítendő rendszer statikus struktúráját, azaz a magas szintű architektúrát megvalósító komponenseket, a komponenseket megvalósító osztályokat és ezek kapcsolatait. Ezek után ismertetem az osztályok metódusainak be- és kimenetét képző (az Autonomy által biztosított, vagy saját tervezésű) adatstruktúrákat. Végezetül a rendszer viselkedését rendszerállapotok és szekvenciák (valamint trendelemzés esetén a szükséges időzítések) megtervezésével határozom meg. A tervezést követően az implementáció során előállt eszköz validációja szerepel.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.