Hiányzó genotipizálási adatok kezelése

OData támogatás
Konzulens:
Dr. Hullám Gábor István
Méréstechnika és Információs Rendszerek Tanszék

A genotipizálás egy költséges folyamat, mely DNS szekvenciák meghatározásakor tévedhet. A hiányos genetikai adatok pótlása valószínűségi következtetéssel és mesterséges intelligencia segítségével olcsó megoldást nyújt új mérések elvégzése nélkül.

Szakdolgozatomban ismertetem az IMPUTE version 2 szoftver működését, mely hatékony eljárást nyújt ismeretlen és hiányos genetikai adatok pótlására. A program hatékonyságát több szempontból vizsgáltam. 12 különböző hiányzási arányú genetikai adathalmazon végeztem el a pótlásokat és az SNP-k allélgyakorisága szerint is mértem a pótlás teljesítményét. A program eredményeit összevetem az általam létrehozott, az egyes allélok eloszlásán alapuló pótló eredményeivel, hogy meghatározzam milyen keretek között érdemes használni az IMPUTE v2-t.

Az IMPUTE v2 minden hiányzási arány mellett jobban teljesített, mint az SNP-k alléljainak marginális eloszlásán alapuló pótlás, az SNP-k allélgyakoriságától függetlenül.

A hiányos fájlok előállítását, formai átalakítását és a mérések vizsgálatát saját fejlesztésű programokkal végeztem.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.