Többnyelvű gépi szótagolás mély neurális hálózatokkal

OData támogatás
Konzulens:
Ács Judit
Automatizálási és Alkalmazott Informatikai Tanszék

A szótagoló algoritmusok az elválasztás feladatának számítógépes megoldásai és legtöbbször dokumentumok tördelésekor használják. Mindemellett a szavak elválasztásának hatása van a költészetben vagy akár a szövegfelolvasó, szövegfelismerő alkalmazások fejlesztésében is.

A mélytanulásos módszerek előretörésével megnőtt az igény a nyelvtechnológiai problémák gépi tanulás alapú megoldására is. Az online elérhető corpus adatbázisok mennyisége elősegíti, hogy a módszereket kipróbálhassuk olyan problémákon is, mint a szótagolás.

Az itt következő dolgozatban a szerző egy új fajta szótagoló algoritmust ismertet. A jelenleg használt szótagoló algoritmusok rövid ismertetője és három nyelvtechnológiában elterjedt neuráls háló (előrecsatolt neurális háló, konvolúciós háló, rekurrens háló) bemutatása után rátér ezek alkalmazására a szótagolás terén.

A dolgozat ismertet továbbá egy negyedik hálót is (sequence-to-sequence), a nem standard elválasztási problémák megoldására, valamint bemutat egy többnyelvű elválasztó algoritmust.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.