Véleményanalízis ügyfelek visszajelzéseinek monitorozására

OData támogatás
Konzulens:
Dr. Szűcs Gábor
Távközlési és Médiainformatikai Tanszék

A XXI. század erős technológiai hullámai a felhasználók által előállított tartalmak sebességének exponenciális növekedéséhez vezettek. Az adatmennyiség, ami keletkezik minden nap hihetetlenül megnőtt, Moore törvénye érvényét vesztette. A mai adat-vezérelt világban a Big Data fogalma jól ismert minden specialista körében ezen a szakterületen. A mennyiség, a sebesség és a változatosság (angolul volume, velocity és variety, azaz a 3 V) meghatározó kulcsszavak, ha adatról van szó.

A web 2.0 és közösségi hálók elterjedésével a felhasználók lehetőséghez jutottak, hogy megosszák a gondolataikat számos módon és csatornán keresztül hozzájárulva így mindhárom V-hez. Az adat mennyisége meghaladja a saját határait, emberi erővel már nem feldolgozható, így a feldolgozásához automatizált megoldásokra van szükség. Az üzleti intelligencia és az adatbányászat megoldást jelent egy üzlet saját adatainak megértéséhez és piaci előnyhöz juttatja ezáltal a céget. A szövegbányászat már nem csak a siker kulcsát jelenti, hanem művelése szükségszerűvé vált, főleg azon cégek számára, akik a felhasználók által generált tartalmakra helyezik a fő hangsúlyt, különben kiesnek a piaci versenyből.

A diplomamunkám felhívja a figyelmet a felhasználók által előállított tartalmak szövegbányászatának fontosságára, ismerteti a szakterület jelenlegi helyzetét és a kihívásokat, amikkel a szövegbányászat szembesül napjainkban. A dolgozat bemutat egy keretrendszert is, mint legjobb gyakorlat, hogy az üzleti intelligencia projekteket mi alapján tervezik és viszik végbe.

Amellett, hogy bemutatok néhány dobozos szoftveres megoldást, betekintést adok olyan analitikus eszközök világába is, amik lehetővé teszik a felhasználó számára, hogy saját modelleket készítsen az adatok bányászásához. A diplomamunkám magában foglal egy áttekintést is ezen eszközök jelenlegi piacáról.

A modellek, amiket a véleményanalízis folyamatának bemutatásához építettem, a Rotten Tomato filmes adatbázisából származó filmekről írt véleményeket dolgozzák fel két olyan analitikus eszközzel, amit a dolgozatban bemutattam. Részletesen leírom a modellek működését mielőtt különböző mérőszámok alapján értékelném őket, illetve összehasonlítanám a két folyamat eredményét.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.