Klaszterezési módszer alkalmazása betűalak-azonosításban

OData támogatás
Konzulens:
Dr. Hosszú Gábor
Elektronikus Eszközök Tanszéke

A szakdolgozat a matematikából ismert klaszteranalízist alkalmazza a régi írásokban használt írásjelek fejlődési összefüggéseinek feltárására. Ennek első lépéseként áttekintésre és összehasonlításra kerülnek a különböző klaszteranalízis módszerek. Mivel ez egy nagyon szerteágazó, sok különböző tudományban használt eszköz, ezért törekedtem arra, hogy a bemutatásuk minél egyszerűbb és gyorsan áttekinthető alakban történjen.

A régi írások közül a 7. és a 11. század között Kelet-Európában használt kazáriai rovásírást (KR) választottam, mivel az ezzel az írással számos írásemlék fennmaradt, ugyanakkor ennek az írásnak a kialakulása ma sem teljesen feltárt. Kiindulásul egy olyan adatbázist használtam, amely a különböző KR karakterekről tartalmazott adatokat az eredetükkel, valamint azzal kapcsolatban, hogy milyen nyelvű feliratokban maradtak fenn. Meghatározhatók azon egyéb írások, amelyekből az egyes KR betűk átkerülhettek a KR-ba az alakzati hasonlóságuk és az általuk jelölt hangértékek alapján. Ezeket az információkat szintén tartalmazta a kiindulásul használt adatbázis.

Szakdolgozatom célja ennek az adatbázisnak a klaszterelemzése, azaz az adatbázis objektív módszeren alapuló feldolgozása, melynek segítségével feltárható az egyes karakterek kapcsolatrendszere, és így segítségét nyújthat a történészek számára, annak további elemzésére.

Az elemzések eredményeképpen egyes – korábban csak elméletileg feltételezett összefüggéseket sikerült statisztikus összefüggésekkel is igazolni.

Az elvégzett vizsgálatok során fontos szempont volt, hogy a fenti klaszteranalízist végző szoftver minél egyetemesebb legyen, azaz későbbiekben is alkalmazható legyen más elemzésekhez úgy, hogy eközben a szoftvert minél kisebb mértékben kelljen módosítani.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.