Új gépi tanulási módszerek alkalmazása szövegelemzésben

OData támogatás
Konzulens:
Dr. Pataki Béla József
Méréstechnika és Információs Rendszerek Tanszék

A bevételek megjóslása gazdasági szempontból rendkívül fontos feladat. Egyes termékek és szolgáltatások bevétele pedig erősen függ a róluk keringő hiresztelésektől, függetlenül azok igazságtartalmától.

Korunkban a társadalmunkban történő információcsere jelentős része a közösségi médián keresztül zajlik, ennek következtében az ott megjelenő szövegek elemzésével jelentős tudásra tehetünk szert, ha megfelelő módon ki tudjuk nyerni az információt. Az érzelmek bevételre gyakorolt hatása nem triviális. A boldogságnál akár nagyobb súllyal számíthat a szomorú benyomások összessége.

A dolgozat célja egy filmek bevételeinek jóslására alkalmas modell felépítése Twitter bejegyzések alapján. A tweet-ek érzelmi töltetének kinyerése érdekében a szövegben megtalálható emotikonok alapján érzelmi osztályokat definiálunk, majd ezek szempontjából értékeljük az összes tweet-et.

Mutatókat készítünk a tweet-ek jellemzői alapján, és ezek segítségével felállítjuk a modellünket a filmek bevételeink megjóslására.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.