Naplófájlok nyelvi modellezésére épülő hibadetektálás

OData támogatás
Konzulens:
Dr. Mészáros Tamás Csaba
Méréstechnika és Információs Rendszerek Tanszék

Egy komplex rendszer működése és tesztelése során rengeteg naplófájlt generál, amelyekben az esetleges hibák oka rejtőzik. Gyakran egy fejlesztő számára hosszadalmas ezen okok feltárása. Szakdolgozatomban egy olyan módszert mutatok be, amelyben statisztikai modellt építek a helyesen lefutó tesztek naplófájljai alapján azt remélve, hogy a helytelen működés így detektálható. Esetemben egy telekommunikációs rendszer egy csomópontjának hálózati forgalmat figyelem, mert a tesztek lefutása során ilyen jellegű naplófájlok is rendelkezésre állnak. A hálózati forgalmat úgy fogom fel mintha egy párbeszéd lenne, melyben mondatok és szavak sokasága sorakozik fel. Egy üzenet egy szónak felel meg és egy mondat egy teszteset által okozott hálózati forgalom. A mondatokat felhasználom egy nyelvi modellnek a tanítására. Az ilyen jellegű problémák esetében nagy hangsúlyt kell helyezni a modell kiértékelésének procedúrájára. Ezért be fogok mutatni különböző kiértékelési algoritmusokat és lehetőségeket, melyek hol jobb, hol rosszabb teljesítményt nyújtanak. A legjobb teljesítményű kiértékelő algoritmust beleintegrálom egy szoftverbe, melynek feladata, hogy a valószínűségek között találjon kiugró értékeket, amelyek minden bizonnyal a hibát okozhatták. A kiugró értékek kiemelésével a rendszer ajánlásokat tud tenni az esetleges hibák helyére. Az elkészített szoftver így képes a hibák 80%-ának detektálására.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.