Magyar szentiment elemezés neurális hálózatokkal

OData támogatás
Konzulens:
Ács Judit
Automatizálási és Alkalmazott Informatikai Tanszék

Napjainkban egyre nagyobb népszerűségnek örvend a szentiment elemzés, melynek célja természetes nyelven írott szövegek hangulatának megállapítása számítógép segítségével. Ez részben az információ gyors növekedésével, részben pedig a számítási kapacitás egyre könnyebb elérhetőségével magyarázható. Angol szövegen a legjobb eredmények magasabb, mint 90 %-os pontosságot értek el, de magyar szövegre csak korlátozott lehetőségek állnak rendelkezésre, így a legjobb módszerek valamivel 80 % felett teljesítenek.

Dolgozatom célja egy módszer kidolgozása, mely kellő pontossággal jelzi mondatok szentimentjét. A módszer implementálásához konvolúciós, rekurrens és klasszikus neurális hálók is felhasználásra kerülnek. Néhány modell lexikonokat is használ a pozitív és negatív szavak azonosításához. Implementálásra kerülnek komplex modellek is, melyek többféle hálót, vagy megközelítést alkalmaznak. A modellek az OpinHuBank korpuszon tanulnak, mely egy-egy entitásra vetítve osztályozza a szövegeket. Míg a pozitív-negatív osztályozási feladatra bemutatott legjobb modell pontossága 80 %, a 3 osztályos predikció kicsivel 60 % feletti pontosságot ad.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.