Facebook hozzászólások előrejelzése transzfer tanulással

OData támogatás
Konzulens:
Dr. Szűcs Gábor
Távközlési és Médiainformatikai Tanszék

A közösségi média mindennapjaink részévé vált. A vállalatok is gyakran használják a Facebookot az ügyfeleik elérésére. Viszont a széleskörű nyilvánosságnak ára van, a negatív vélemények és a hamis hírek is futótűzként terjednek az interneten. A gyors reakció ilyen esetekben kulcsfontosságú a rosszindulatú pletykák megállításában. Szűkségessé vált a nagy mennyiségű internetes tartalom automatikus feldolgozása.

A diplomaterv célja olyan algoritmusok kifejlesztése és elemzése volt, amely a Facebook posztok előzménye és szerzőjének tulajdonságai alapján megbecsüli a posztokra érkező hozzászólások mennyiségét a közeljövőben. Az ilyen algoritmusoknak nagyobb mennyiségű tanító adatra van szűksége a hatékony modell elkészítéséhez. Nehéz feladat megfelelő méretű, reprezentatív tanító adatbázist készíteni, mert a felhasználók nem szívesen adnak hozzáférést az internetes magánszférájukhoz.

Csak Facebookról gyűjtött adatok nem elégségesek egy pontos modell elkészítéséhez. Transfer learning módszerek segítségével lehetőség van egy hasonló területről gyűjtött adatbázisból olyan információkat kinyerni, amelyek segítségünkre lehetnek a modell építésekor. Nagy mennyiségű adat áll rendelkezésre magyar blogokról. Egy korábbi kutatás során a blog adatbázis segítségével jelezték előre, hogy hány hozzászólás fog érkezni egy újonnan megjelenő blog posztra. A diplomaterv során ezeket az adatokat használtam kiegészítő adatforrásként a modellépítéshez.

A diplomaterv áttekinti az ismert transfer learning technikákat és a használt terminológiát, valamint összehasonlítja a következő algoritmusok hatékonyságát: naiv transzfer (amely során csak a két adatbázis közös metszetét használjuk fel), lineáris regresszió független attribútumokat feltételezve, multitask regresszió és kNN regresszió.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.