Képek és háromszöghálók szegmentálása algebrai topológiai módszerek segítségével

OData támogatás
Konzulens:
Dr. Várady Tamás László
Irányítástechnika és Informatika Tanszék

Feladatom algebrai topológián alapuló kép és háromszögháló szegmentálási algoritmusok megismerése és előbbiek implementálása volt. Az algebrai topológia absztrakt algebrai struktúrákat vizsgálva deríti fel az alakzatok topológiáját, a szorosan kapcsolódó Morse-elmélet pedig fokozatosan építi fel a teret, követve a topológiában végbement változásokat. A két megközelítés közötti kapcsolatot a perzisztencia elmélet teszi kvantitatívvá, a lépésenként felépülő alakzat topológiai sajátosságaihoz egy mérőszámot - az élettartamot - hozzárendelve. Ezt az elméletet szegmentálási alkalmazásokban főleg az un. watershed-alapú módszereknél lehet hasznosítani. A watershed-eljárás lényege, hogy a képet, vagy hálót úgy tekintjük, mint vízzel elárasztott domborzatot, melynek medencéiben tavak formálódnak. A vízszint növekedésével a szomszédos medencék víze összeér az un. watershed (vízválasztó) vonalak mentén és ezek a vonalak alkotják a szegmenshatárokat. Ez általában durva túlszegmentáláshoz vezet, ezért egy összevonási lépés is szükséges, melyhez segítségül lehet hívni a perzisztencia-elméletet.

A vizsgált algoritmusok alapja egy Frederic Chazal és társai által publikált klaszterezési eljárás, amely szomszédsági gráfot épít fel a watershed-eljárásnak megfelelő módon és a nyeregpontban összeérő szegmenseket, az általuk képviselt lokális szélsőérték és a nyeregpont szintkülönbsége, azaz perzisztencia alapján vonja össze. Szürkeárnyalatos képek esetén maga a bittérkép vagy annak gradiense adja a gráfot, míg a színes képeket egy pontfelhőre képezzük le a színtérben és a sűrűsödési pontok vonzáskörzetét határozzuk meg. Háromszöghálókat általában a görbület becsült értéke alapján érdemes szegmentálni.

A feladatkiírásnak megfelelően csak a képszegmentálási algoritmusokat implementáltam, C++ nyelven. Szürkeárnyalatos esetben kellően zajtűrő gradiens szűrők alkalmazásával bíztató eredményeket kaptam szintetikus és egyszerűbb természetes képekre. Színes képekre lényegében sikerült reprodukálni az eredeti publikáció eredményeit, ugyanakkor az algoritmus viszonylag nehezen hangolható és további optimalizációra lehet szükség a gyakorlati használhatósághoz.

Háromszöghálókra áttekintettem az elterjedtebb indikátorfüggvényeket és a perzisztencián alapuló szegmentációs algortimusokat, továbbá egy lehetséges implementáció különböző aspektusait.

[1] INRIA (Institut National de Recherche en Informatique et en Automatique), Saclay, Franciaország

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.