RNS molekulák térszerkezetének előrejelzése

OData támogatás
Konzulens:
Dr. Csima Judit
Számítástudományi és Információelméleti Tanszék

A biológia világában számos olyan kérdés merül fel, amiknek a megválaszolásához nem elegendő csupán ezen a tudományterületen tanult ismereteket használni, hanem szükség lehet programozási, algoritmikus és egyéb matematikai ismeretekre is. A bioinformatika ezen tudományterületek segítségével igyekszik megoldást találni biológiai kérdésekre.

Egy ilyen probléma az RNS láncok másodlagos struktúrájának a becslése. A másodlagos struktúra egy RNS-ben a párokat alkotó nukleotidok halmaza. Csupán az elsődleges struktúrából, ami a nukleotidok láncbeli sorrendje, nem számítható ki egyértelműen a másodlagos struktúra, azonban egy RNS molekula tulajdonságait ez a másodlagos struktúra határozza meg a legnagyobb részben, ezért hasznos lenne egy algoritmus, amivel minél pontosabb képhet kaphatunk erről.

Rendelkezésünkre állnak bizonyos információk, hogy bizonyos feltételek mellett milyen kapcsolatok alakulhatnak ki, például tudjuk, hogy csak bizonyos nukleotid párok között jöhet létre kapcsolat. Egy adott RNS lánchoz azonban még így is rengeteg különböző másodlagos struktúra tartozhat.

Mivel fel tudunk írni bizonyos szabályokat az RNS láncok szerkezetéről, ezért akár tekinthetjük is a nukleotidok sorozatát egy mondatnak, amiben a nukleotidok a szavak. A szabályok alapján pedig készíthetünk nyelvtani szabályokat, amik megmondják milyen módon hozhatunk létre egy-egy mondatot. Itt jönnek be a képbe a számítástechnikai értelemben vett nyelvtanok, ezek közül is a környezetfüggetlen nyelvtanok.

Ismert, hogy a CYK algoritmussal megkapható egy mondat levezetési fája egy környezetfüggetlen nyelvtanban. Amennyiben a nyelvtanban úgy vettük fel a szabályokat, hogy azok a másodlagos struktúrát jelzik, az algoritmus futtatásával megkapható az RNS térbeli szerkezete.

Szükséges még, hogy csak a legvalószínűbb levezetési fát találjuk meg. Ennek megoldására valószínűségeket rendelhetünk az egyes szabályokhoz. A valószínűségek pontos meghatározásához az inside-outside algoritmus és az EM algoritmus ad segítséget.

A diplomamunkám célja, hogy elkészítsek egy programot, ami a felsorolt technikák felhasználásával megjósolja RNS-ek másodlagos struktúráját.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.