Kulcsszó ajánlás tudományos cikkekhez gépi tanulással

OData támogatás
Konzulens:
Dr. Tapolcai János
Távközlési és Médiainformatikai Tanszék

Tudományos kutatások során az egyik legfontosabb lépés feltérképezni a kutatott

problémához kapcsolódó tanulmányokat. Egy népszerű terület esetén komplikált

lehet megtalálni a kutatott témához legjobban kapcsolódó tanulmányokat.

A tanulmányok szerzői kulcsszavakat adnak meg, melyek adnak egy betekintést

a tanulmány tartalmára, valamint a tanulmányok kereshetőségét is elősegítik. Bizonyos

esetekben viszont megkérdőjelezhető, hogy az egyes kulcsszavak mennyire

relevánsak, illetve a megadott kulcsszavak halmaza hiányos lehet. A természetes

nyelvfeldolgozás egyik legfontosabb technológiájává vált a mély tanulás, így ígéretes

lehetőségeket nyújt a kulcsszó hozzárendelés automatizálására.

A diplomamunkám legfőbb témája a kulcsszó ajánlás tudományos cikkek tartalmi

kivonata alapján. Dolgozatomban először bemutatom a probléma technikai és elméleti

hátterét. Bemutatom a természetes nyelvfeldolgozáshoz kapcsolódó fontosabb koncepciókat,

definíciókat, technikákat, mérőszámokat valamint a következő három alkalmazási

területét:

• Kulcsszó hozzárendelés

• Összefoglalás generálás

• Cím ajánlás

Bemutatom, hogy a gépi tanulás — szűkebb értelemben a mély tanulás — hogyan

kezeli a természetes nyelvfeldolgozás problémáit, illetve, hogy mely típusú mély

neurális hálók a legalkalmasabbak erre a feladatra és azt is, hogy miért. A gépi

tanulást vagy más megközelítést használó osztályozási feladatok fontos része az eredmények

értékelése, mérése. A kiértékelés témáját két nagyobb részben mutatom be:

először az általános osztályozási metrikákat mutatom, majd a kulcsszó hozzárendelési

feladat több célváltozós jellege miatt részletezem a több célváltozós osztályozási

feladatok mérésének hátterét, az ahhoz használt mértékegységeket.

A használt adathalmaz fontos része a munkámnak, azt egy külön fejezetben mutatom

be.

5

Dolgozatomban összefoglalom, hogy milyen eredményeket értem el az elmúlt két

félévben, illetve azt is, hogy milyen módon lehetne a megoldásokat tovább fejleszteni,

az eredményeken javítani, milyen más megközelítéseket lehetne alkalmazni.

Végezetül összefoglalom a dolgozatban leírtakat és megpróbálok végső konklúziót

vonni.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.