Morfológiai szegmentáció ConvLSTM hálózatokkal

OData támogatás
Konzulens:
Ács Judit
Automatizálási és Alkalmazott Informatikai Tanszék

A szakdolgozat célja morfológiai szegmentációs modellek létrehozása LSTM

és konvolúciós LSTM modellek felhasználásával. Magyar nyelvű szavakon és

mondatokon kísérletezünk többféle neurális hálózattal annak érdekében, hogy

minél precízebb modelleket fejlesszünk ki, melyek túlteljesítik a legkorszerűb

mélytanuló megoldásokat is. Továbbá sebességük és konvergenciabeli különbségek

alapján összehasonlítjuk a statikus és dinamikus hálózatokat. Bemutatjuk a

főbb, gradiens alapú minimalizálást alkalmazó mélytanuló algoritmusokat, különös

tekintettel a konvolúciós és rekurrens neurális hálózatokra. Ismertetjük az

alkalmazott módszereket, amelyekkel a magasabb pontosság elérése érdekében

komplex architektúrákat állítottunk össze. Az architektúrák létrehozásánál nagyban

segítették munkánkat a tudományterületen végzett legújabb kutatások, eredmények.

Mivel a modellek adattal jól skálázódnak, a bemutatott hálózatok teljesítménye

a jövőben tovább növelhető nagyobb korpusz bevonásával. Hyperparaméter

optimalizálást végeztünk a legjobban teljesítő hálózatok megtalálásához, mellyel

feltérképeztük az architektúrában hasonlító, de más paraméterekkel bíró modellek

pontosságát. Semmilyen magyar nyelv-specifikus szabályt nem alkalmaztunk a

megalkotásuknál, így a modellek teljesen nyelvfüggetlenek. Ennek köszönhetően

a későbbiekben más nyelvekre is könnyedén átvihető modellek készültek, melyek

a morfológiai szegmentáción kívül más, címkézéssel kapcsolatos feladatot is

képesek ellátni. Összehasonlítottuk a legjobban teljesítő szó és mondat alapú

modelleket annak érdekében, hogy megtaláljuk a legjobb magyar nyelvű szegmentáló

algoritmust. Ezek teljesítményét automatikusan értékeltük a tanítás során, elkerülve

a nagyobb modellek túltanítását. Készítettünk továbbá Python-alapú notebookokat,

melyek segítségével a modellek eredménye vizsgálható, illetve értékelhető, hogy

mennyire közelíti az emberi pontosságot a modellek által szolgáltatott predikció.

A teljes kódot nyílt forráskódúvá tettük, valamint az adatot és a legjobban teljesítő

modelleket csatoltuk a repository-hoz.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.