Klaszterező algoritmusok vizsgálata

OData támogatás
Konzulens:
Kovács Ferenc
Automatizálási és Alkalmazott Informatikai Tanszék

A klaszterező algoritmusokat a 20. század közepe táján kezdték el aktívan kutatni. Ez azóta töretlenül halad és napjainkban már sokféle klaszterező algoritmus létezik. Ezek az algoritmusok nem egységesek, hanem eltérnek egymástól például a klaszterezett adathalmaz méretében, dimenziójában és típusában, stb. Annak eldöntése, hogy melyik adaton melyik algoritmust használjuk nem triviális feladat. Valamint további kihívást jelent az algoritmus felparaméterezése és a megfelelő távolságfüggvény kiválasztása.

A szakdolgozatom témája, a klaszterező algoritmusok megismerése, implementációja és tesztelése. Feladatom kivitelezéséhez, egy olyan rendszer szükséges, ami képes beolvasni, megjeleníteni, feldolgozni és elmenteni az adatokat. Emiatt az algoritmusok implementálását, a Knowledge Modeling and Data Mining (KMDM) adatelemző és modellező program keretrendszerében végeztem el. A KMDM egy már működő alkalmazás, ami jelenleg is fejlesztés alatt áll az Automatizálási és Alkalmazott Informatikai Tanszéken. Szakdolgozati munkám az első lépés az irányban, hogy a klaszterező algoritmusok, illetve a klaszterezéshez tartozó validációs és vizualizációs eljárások a KMDM részévé váljanak. Mivel a rendszer felépítése alapvetően ideális ilyen feladatokra, ezen algoritmusok és eljárások implementálását hasznosnak vélem.

A keretrendszer előnye, hogy elfedi a komputációs részleteket, mint például a különböző eljárások közötti adatáramlást és grafikus felületet biztosít a projektek kezelésére. Emiatt nagy hangsúlyt helyeztem arra, hogy a klaszterezéshez nem szorosan kapcsolódó dolgokat úgy implementáljam, hogy azok más feladatokhoz is használhatóak legyenek. A klaszterezés implementálásánál, pedig egy olyan környezetet akartam kialakítani, amely elfedi KMDM keretrendszert és könnyebben lehet benne implementálni a klaszterező algoritmusokat. Az elmúlt év során ezeket a célokat szem előtt tartva írtam meg a klaszterező, valamint validációs algoritmusokat és az eredmények szemléltetéséhez különböző eszközöket fejlesztettem ki.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.