Statisztikai gépi fordítás

OData támogatás
Konzulens:
Dr. Juhász Sándor
Automatizálási és Alkalmazott Informatikai Tanszék

Feladatom egy egyszerű statisztikai gépi fordítómotor elkészítése, mely a rendelkezésére bocsátott kétnyelvű tanítóhalmaz megfelelő feldolgozása után alkalmassá válik teljes mondatok egyik nyelvről a másikra történő fordítására, valamint ezen program által előállított fordítás minőségének a vizsgálata.

Dolgozatomban a bevezető után először röviden ismertetem a gépi fordítás történetét, majd bemutatom az ismert statisztikai fordítási módszerek általános jellemzőit, alkalmazhatóságuk feltételeit, és hogy ezek alapján hogyan fogtam neki a saját fordítóprogramom elkészítéséhez. Mint látni fogjuk, a statisztikai fordítás általános modellje alapján három egymástól jól elkülöníthető problémára osztható. A további fejezetek ezeket a problémákat veszik sorra. Ezen fejezeteket a szakirodalom rövid, de kellően alapos áttekintésével kezdem, ahol ismertetem az elterjedt megoldásokat, majd - ha ez szükséges vagy segíti a megértést- bemutatom az elvégzett méréseket és az implementáció részleteit.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.