Természetes nyelvgenerálás generatív adverziális hálózatokkal

OData támogatás
Konzulens:
Ács Judit
Automatizálási és Alkalmazott Informatikai Tanszék

A mély neurális hálók a közelmúltban egyre nagyobb sikereket értek el a természetes nyelvfeldolgozásban. Egy lehetséges módja a szekvenciális szöveg generálásának a generatív adverziális hálózatok használata. A generatív adverziális hálózatok (GAN-ok) az elmúlt évek egyik legsikeresebb architektúrájának bizonyultak a deep learning-ben, különösen a képfeldolgozásban. A természetes nyelvek területén jóval kisebb szerepet kaptak eddig a GAN-ok, köszönhetően az alapvetően folytonos természetüknek, ami a diszkrét szimbólumokból álló természetes nyelvet nehezen megközelíthetővé teszi. A generatív modellek legegyszerűbb alkalmazási területe a mintagenerálás zajból, vagyis a szöveggenerálás, amellyel eddig csak néhány nagyobb nyelven kísérleteztek.

Feladatom az volt, hogy megismerkedjek a GAN architektúrával, létrehozzak tanítható modelleket, melyek szöveggenerálására alkalmasak, feltanítsam őket, majd értékeljem az eredményeket.

Szakdolgozatom során megismerkedtem a Variational Autoencoder és a GAN architektúrával, elmélyültem a szövegfeldolgozás alapjaiban, létrehoztam a GAN-nal együtt háromféle szöveggenerálára alkalmas neurális hálót, majd feltanítás után ezeknek kimeneteit értékeltem, összehasonlítottam.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.