Szentimentelemzés magyar nyelven

OData támogatás
Konzulens:
Ács Judit
Automatizálási és Alkalmazott Informatikai Tanszék

Az információs társadalom által generált szöveges adatmennyiség drasztikus növekedésének köszönhetően az automatizált elemzési megoldások egyre szélesebb körben kezdtek elterjedni. A természetes nyelvfeldolgozás, azon belül a véleménykinyerés napjaink egyik legnépszerűbb kutatási területévé emelkedett, melyet a nemzetközi versenyekre és konferenciákra benyújtott számos koncepción felül a nagyvállalati megoldások jelenléte is alátámaszt. Egyre jelentősebb piaci igény mutatkozik a szövegrészletekben előforduló entitásokra (tulajdonnevek, földrajzi és intézménynevek) lebontott, részletes kimutatások iránt. Utóbbira jó példa a világ egyik legnagyobb videó streaming szolgáltatója, mely valós idejű elemzésre képes véleménydetektáló rendszer integrálásával biztosít interaktív videózási élményt.

Dolgozatom egy magyar nyelvű szövegrészletek entitásorientált szentiment elemzésére alkalmas megoldás elkészítésének részletes bemutatásáról szól. Munkám során az OpinHuBank korpuszt felhasználva, úgy tanítottam be a modellt, hogy képes legyen a szövegrészletben fellelhető egyes entitásokra vonatkozó polaritások megállapítására. Az implementáció során törekedtem a valós életben történő alkalmazhatóságra, ezért az iteratív fejlesztési folyamat során életszerű példákon is megvizsgáltam az éppen aktuális modell pontosságát. Az optimális konfiguráció kiválasztása után, a későbbi felhasználása érdekében egy intuitív fejlesztői interfészt készítettem és a teljes megoldást Docker imagebe elkészítve nyilvánosságra hoztam. Mivel magyar nyelvre alkalmazható, s publikusan elérhető ilyen jellegű megoldás még nem állt rendelkezésre, ezért úgy véltem, mások számára is hasznos implementáció születhetett.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.