Prediktív szöveg-beviteli módszerek vizsgálata természetes nyelvek fordításánál

OData támogatás
Konzulens:
Dr. Juhász Sándor
Automatizálási és Alkalmazott Informatikai Tanszék

Jelen dolgozat témája természetes nyelvek közötti fordítás során automatikus gépelési javaslatok felajánlása (prediktív gépelés) a fordító számára. A cél minél jobb javaslatok nyújtása, ezáltal a fordításhoz szükséges billentyűleütések számának csökkentése. A háttérben működő algoritmusok szempontjából vizsgálom meg a célt megvalósító szoftvereket.

A dolgozat elején bemutatom a prediktív gépelés korábbi alkalmazási terüleit (szövegbevitel gyorsítása erre korlátozott lehetőségeket biztosító eszközökön) és a hozzájuk tartozó kutatási eredményeket, kitérve a gépi fordítással való kapcsolatra is.

Ismertetem a megvalósító algoritmusoktól elvárt tulajdonságokat a működési környezetébe, egy fordítástámogató szoftverbe történő illeszkedésén keresztül. A kidolgozott algoritmusok nagy mennyiségű, már meglévő szövegből és fordításából statisztikai eszközökkel szótárat készítenek, melyet később, egy fordítás során fel lehet használni gépelési javaslatok felajánlásához.

Összehasonlítási referenciaként mutatok egy, a mobiltelefonokon megtalálható prediktív gépelési szolgáltatást alapul vevő megoldást, mely a fordítandó szöveget figyelmen kívül hagyja, csupán a gépelési nyelvre támaszkodik. Ezután részletezek egy számos paraméterrel és variációs ponttal rendelkező kétnyelvű megoldást, mely a fordítandó szöveget és a gépelési nyelvet is figyelembe veszi a gépelési javaslatok biztosításához.

A különböző megoldások összehasonlítására egy mérési keretrendszert dolgoztam ki, mely az algoritmusok paramétereit változtatva automatikusan készít szótárakat és értékeli őket egy szimulált fordítói munka során.

Méréseket végeztem angol, német és magyar nyelvek közötti (mindkét irányú) fordítás során különböző szövegdarab típusokkal, küszöbökkel és pontszám számítási módszerekkel. A keletkező szótárakat a fordító számára nyújtott segítség mennyisége alapján hasonlítom össze, melyet a leütött billentyűk számának csökkenése mutat a legjobban.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.