Szagminták felismerési feladatának adatbányászati megoldása Oracle Data Miner használatával

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

Az emberek az életük során egyre gyakrabban kerülhetnek olyan szituációba, amikor a náluk lévő csomagoknak valamilyen ellenőrzésen kell átesnie. A csomag-vizsgálat korábban főként határátkelőhelyeken, különleges és nagy forgalmú turisztikai létesítmények bejáratánál (pl. a Szent-Péter Bazilika), vagy esetleg büntetés-végrehajtó intézeteknél volt jellemző. Mára azonban a biztonsági előírások egyre több helyen korlátozzák egy adott helyre vagy intézménybe bevihető tárgyakat. A másik oldalról viszont egyre korszerűbb technológiai rendszereket szükséges alkalmazni a tiltott anyagok detektálására. Ennek egyik lehetséges módja a tárgyak szag alapú felismerése. Ez a feladat az informatikai tudományok egyik népszerű területével, az adatbányászat eszközeivel is megoldható.

A diplomaterv keretében a rendelkezésre álló nagymennyiségű tanító adattáblák felhasználásával olyan adatbányászati modellt építek, amely felismeri a kiértékelő adattáblában lévő mintákat, választ adva ezzel arra a kérdésre, hogy mikor és milyen anyag volt a szagérzékelő eszköz előtt. A mintafelismerés itt osztályozást jelent, a használt adatbányászati algoritmus pedig az SVM, ami a teszteken rendre 5–10% kal jobb eredményt ért el a többi algoritmussal szemben.

A dolgozat során a CRISP-DM adatbányászati módszertan lépcsőin haladok végig, kiegészítve azt az osztályozó algoritmusok elméletének ismertetésével. Emellett logikusan felépített tesztesetekkel is alátámasztom a választott algoritmus helyességét, és a végleges modellrendszer hatékonyságát. A munka az eredmények kiértékelésével zárul, aminek során megállapítható, hogy a végleges rendszer 90% feletti helyes mintafelismerési tulajdonsággal rendelkezik.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.