Mélytanulás-alapú chatbot modellek

OData támogatás
Konzulens:
Recski Gábor András
Automatizálási és Alkalmazott Informatikai Tanszék

Intelligens dialógus ágensek készítése egy jelentős területe a természetes nyelv feldolgozásnak. Párbeszédek generálását két alapvető csoportba lehet sorolni. Heurisztikus vagy sablon alapú rendszerek, melyeknek egy specifikus feladat ellátása a célja, illetve általános célú, mesterséges intelligenciával vezérelt chatbot modellek. Dolgozatomban az utóbbi irányzatot követem és olyan neurális hálózat alapú chatbot architektúrákat vizsgálok, melyek nagy mennyiségű dialógus adaton “tanulva” képesek az emberi párbeszédeket imitálni. Egy tipikus hibája az ilyen módon tanított rendszereknek, hogy a minták valószínűségének maximalizációja során a modell törekedni fog az átlagosan alacsony hibát adó “biztonságos” válaszok generálására. Az ilyen típusú mondatok általában nem informatívak, és nem viszik előre a dialógust, így célszerű lenne őket elkerülni.

A célom a projekttel, hogy egy kétlépcsős tanítási folyamat segítségével olyan párbeszéd generáló rendszert hozzak létre, amely mentes a imént felvázolt problémától. Először maximális valószínűségre optimalizálva egy kiindulási alapul szolgáló modellt készítek, majd megerősítéses tanulást alkalmazok a paramétereinek finomhangolására. Elvárásaim szerint a második fázisban alkalmazott technika korrigálja a valószínűség maximalizálás nem kívánatos hatását. A munkám elérhető az alábbi linken https://github.com/Mrpatekful/ParlAI.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.