Szövegbányászati technikák alkalmazása beszédfelismerési kimenetek elemzésére

OData támogatás
Konzulens:
Dr. Mihajlik Péter
Távközlési és Médiainformatikai Tanszék

A szövegbányászat egy viszonylag fiatal, innovatív részterülete az adatbányászatnak, mely kifejezetten a strukturálatlan, szabad formátumú szöveges adatokkal foglalkozó szakterület. Ennek eredményeképpen remek lehetőséget nyújthat beszédfelismerési kimenetek elemzésére. Ezen felül a beszédfelismerés és a szövegfeldolgozás területe is hasonló problémákkal küzd, hiszen a természetes nyelvek elsősorban az emberek közötti kommunikáció céljára alakultak ki, nem pedig a számítógépes feldolgozás szempontjai szerint. A dolgozatom célja e két technológiának az egymást támogató használata illetve ismertetése. Egy beszédfelismerő rendszer által előállított kimenetet fogok elemezni különböző szövegbányászati technikákkal az IBM SPSS Modeler adatbányászati szoftver és TextAnalytics moduljának segítségével. A vizsgálat célja, hogy egy hazai biztosító cég ügyfélszolgálati telefonbeszélgetéseinek felismerési kimenetéből próbáljunk következtetéseket levonni a biztosításkötések sikerességének fényében.

A dolgozatom első fejezetiben ismertetem a technológiák elméleti hátterét, a fontosabb alapfogalmakat, algoritmusokat. A 3. és 4. fejezetben ismertetem az elkészített szövegbányászati modell tervezésének és létrehozásának lépéseit, valamint kiértékelem a kapott eredményeket, levonom a következtetéseket. Az 5. fejezetben döntési fa alapú osztályozást és előrejelzést végző modelleket készítek a 4. fejezetben kapott adatok felhasználásával. Az utolsó fejezetben ismertetem a további lehetőségeket, tanulságokat.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.