Gépi tanulási módszerek írásinformatikai alkalmazása

OData támogatás
Konzulens:
Dr. Hosszú Gábor
Elektronikus Eszközök Tanszéke

Jelen szakdolgozat célja, hogy megvizsgálja a gépi tanulás és a bioinformatika eszközeit. A feladatom volt, olyan Matlab szkriptek formájába szervezni ezeket a függvényeket, melyeken bemutatható a működésük. A végleges eredmény pedig egy eszközrendszer kidolgozása volt, amellyel a lehető legtöbb információt nyerjük ki a rendelkezésre álló írásinformatikai adathalmazokból. Létrehoztam egy olyan Matlab live szkriptet és egy Matlab programot, ami könnyen használható formában valósítja ezt meg. Az adathalmaz bináris adatok formájában tartalmaz tulajdonságokat, a végleges program ilyen vagy ezzel azonos formátumú adathalmazok feldolgozást teszi lehetővé. Két központi kérdést vizsgáltam meg a gépi tanulás mellet egyrészt egy evolúciós fa, úgynevezett filogenetikus fa létrehozását. Ezt az indokolta, hogy átlátható formában meg lehet benne rajzolni az írások lehetséges leszármazását. A másik pedig a biográf volt, ami szintén az adatok megjelenítését teszi lehetővé konkrétan az írások hasonlósági viszonyainak ábrázolását egy gráf segítségével. Ezek az eszközök elsősorban genetikai adatok analízisére szolgálnak, ezért nagyon érdekes volt vizsgálni a felhasználásukat.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.