Nagy méretű kemoinformatikai gráfadatbázisok felhasználása hatóanyag-célpont interakciók predikciójában

OData támogatás
Konzulens:
Dr. Antal Péter
Méréstechnika és Információs Rendszerek Tanszék

Szakdolgozatomban különböző predikciós eljárásokat, valamint olyan adatstruktúrákat mutatok be, amiben manapság a predikció hatékonyan történhet. Részletesebben olyan eljárásokkal foglalkozom, amelyek egyszerű gráftopológiai adatokból képesek következ-tetni hasonlóságok alapján. Ezeket az eljárásokat implementáltam, majd az eredménye-ket kiértékeltem.

A téma alapját egy ez évben megjelent tanulmány képezi, melyben a vizsgált algoritmu-sok már implementálásra kerültek [1]. Az implementációra vonatkozó feladat elsősorban a cikkben szereplő adatok reprodukálása és értékelése. A tanulmány eredményeit több-nyire sikeresen megismételtem, néhol hozzá is tudtam adni abban nem vizsgált dolgok eredményét a kiértékeléshez.

A predikciókat bioinfomatikai adatokon végeztem el, hatóanyag-fehérje kölcsönhatáso-kat keresve. Az eljárásokból adódóan nem használtam fel az összes rendelkezésre álló bioinformatikai adatot, ugyanakkor igyekeztem ezekre is kitérni, bemutatni ezek jelentő-ségét.

Az implementációt megelőzően megismerkedtem a manapság egyre népszerűbb szeman-tikus adatstruktúrákkal, majd áttekintettem, hogyan lehetséges ilyen adatbázisokban az interakciók predikciója hatékonyan.

Implementációt R programozási nyelvvel hajtottam végre, ügyelve arra, hogy a kód újra felhasználható legyen. Négy hasonlóságon alapuló predikciót implementáltam a fentebb említett tanulmány alapján. Az R-hez elérhető különböző csomagok segítségével kiérté-keltem, ábrázoltam az eredményeket, amiket később összehasonlítottam egymással, va-lamint mások által publikált eredményekkel. A gráf ábrázolásához a Cytoscape alkalma-zást használtam.

A kiértékelés konklúziójaként elmondható, hogy az implementált eljárások többsége értékelhető eredményt ért el, ugyanakkor elmarad más, további adatokat is felhasználó algoritmusoktól. Az eredmények tükrében elmondható, hogy hatóanyag-fehérje interak-ciók predikciójára nem javasoltak a megvalósított eljárások, mivel az ilyen kutatással foglalkozó szervezetek (pl. gyógyszergyárak) megengedhetik maguknak a költséges, ugyanakkor erős számítógépeket, melyekkel komplexebb, de hatékonyabb predikciók is könnyedén végrehajthatók. Ennek ellenére más területen, ahol nem elérhető erős hard-ware, vagy de novo hatóanyagok esetén, ahol kevés adat áll rendelkezésre a hatóanyag-ról, még mindig értékelhető alternatívát nyújthatnak ezen eljárások.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.