Génregulációs hálózatok tanulása folytonos Bayes-hálókkal

OData támogatás
Konzulens:
Gézsi András
Méréstechnika és Információs Rendszerek Tanszék

Napjaink robbanásszerű információs fejlődésének egyik oka a rohamosan növekvő adatkészletek, amik alapján lényegesen több információt tudunk kinyerni az adott területről, mint arra azelőtt lehetőségünk volt. Ez a fejlődés a humánbiológiai területekre is nagy hatással volt. Jó példa erre a humán genom feltérképezése.

Kutatásom során egy ilyen területtel, a génregulációs hálózatokkal foglalkoztam. Az elmúlt években a microarray mérések megjelenése következtében nagy mennyiségű adat áll rendelkezésre olyan weboldalakon, mint a Gene Expression Omnibus.

Fejlesztésem ilyen adatok feldolgozására irányult. Készítettem egy alkalmazást, amely egy bemeneti adathalmaz alapján megpróbálja rekonstruálni a hálózatban található összefüggéseket folytonos Bayes hálókkal. Implementáltam egy scoring függvényt, amely pontozni képes egyes szülőhalmazok valószínűségét az adatok alapján. A struktúra pontos felépítését két elterjedt lokális keresési módszert használva próbáltam megkeresni: ez a hegymászó algoritmus és a szimulált lehűtés volt. Ezeken felül bevezettem egy regularizációs algoritmust, amellyel tetszőlegesen korlátozni lehet a gráfban szereplő élek számát.

Az eredmények kiértékeléséhez bevezettem különböző kiértékelési metrikákat, megvizsgáltam, hogy a módszer hogyan reagál különböző mennyiségű adatokra. Összehasonlítottam a két keresési függvényt, és arra a következtetésre jutottam, hogy a feladat speciális típusa miatt érdemesebb hegymászó algoritmussal dolgozni. Ezen felül megvizsgáltam a regularizáció hatását a keresési eredményeken, és ajánlottam egy módszert arra, hogy hogyan érdemes a regularizáció súlyozását ideálisan beállítani.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.