Ajánló algoritmusok elosztott rendszereken

OData támogatás
Konzulens:
Dr. Wiener Gábor
Számítástudományi és Információelméleti Tanszék

Diplomatervemben online ajánló algoritmusokat mutatok be, a [Pálovics, Benczúr, Kocsis, Kiss, Frigó, RecSys 2014] cikket követve és azt különböző adathalmazokon végzett további online és elosztott mérésekkel kiegészítve. Az eredményekben a felhasználók közötti időfüggő egymásra hatások kiaknázásának lehetősége rejlik a közösségi média területén. Új ajánló modelleket és kiértékelő mértékeket javaslunk az online ajánlórendszerekhez, ezeknek időfüggő jellegét figyelembe véve. Ezek között bevezetjük a DCG mérték online implicit ajánlási feladatokban alkalmazható változatát. A méréseket egy 70000 felhasználót tartalmazó, a Last.fm rendszeréből származó kétéves idősoron, valamint a nyilvánosan elérhető MovieLens adatsorokon végeztük.

Megvizsgáljuk az algoritmusaink elosztott implementációját is nagyméretű teljesen elosztott peer-to-peer rendszerekben is, robusztus és skálázható módon. Az algoritmus működéséhez az ajánlórendszer adatmátrixa (a felhasználók személyes jellemzői, dokumentumai, médiaállományokra adott értékelésik stb.) a hálózatban elosztottan tárolható, úgy, hogy minden felhasználó csak a saját adataihoz fér hozzá. Így ebben peer-to-peer modellben a személyes információk nem hagyják el a felhasználókhoz rendelt csomópontot az elosztott ajánló rendszer tanítása és működése során. A nagyméretű elosztott rendszerekben alkalmazott algoritmusok, mint például a szinkronizált párhuzamos gradiens keresés vagy az elosztott iteratív módszerek nem alkalmasak az általunk definiált rendszerben, mivel szinkronizált ciklusokat igényelnek, valamint a terheléselosztás kérdése is problémákat vethet fel. A mi megközelítésünk megkerüli ezeket a korlátokat az elosztott sztochasztikus gradiens alkalmazásával, melyben a modell felhasználóhoz köthető részét lokálisan tárolhatjuk, és a globális jellemzők minden csomópontban a helyes értékekhez konvergálnak.

A fő új eredmény a dolgozatban a faktormodellek online és elosztott implementációja az ajánló keretrendszerekben. Az implementációt használva megvizsgáltuk az online algoritmusok hatékonyságát és összevetettük teljesítményüket a hagyományos, periodikusan újratanított változattal.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.