Adatbányászati eljárások vizsgálata hierarchikus csoportok kialakítására

OData támogatás
Konzulens:
Budai Péter István
Irányítástechnika és Informatika Tanszék

Az emberek gyakran használnak hierarchiákat, legtöbbször akkor, amikor nagy adathalmazban szeretnének hatékonyan megtalálni dolgokat. Így van ez a szabadalmaknál is, ahol az óriási adatmennyiséget különféle logikai csoportokba osztják. A csoportokba sorolás nagy időráfordítást igényel a sok szempont miatt, ezért mostanra már az emberek mellett számítógépes programokkal is próbálják gyorsítani ezt a folyamatot.

A szövegek kategóriákba helyezését úgynevezett szövegosztályozó programok végzik, amik statisztikai alapon a szövegeket analizálva működnek, így matematikai problémává alakítva az eredeti feladatot. Ezt a folyamatot ismertetni is fogom egy általam választott szövegosztályozási algoritmusnál.

A jelenleg használt szövegosztályozó programok általában csak egy logikai szinten kategorizálnak. Dolgozatomban azt vizsgálom, hogy számítógépes szövegosztályozási módszerrel a szabadalmi osztályozás hierarchiáját végigjárva milyen eredmény érhető el a hagyományos, egyszintű szövegosztályozással szemben.

A hierarchia egyes elemei között lehetnek ismert vagy rejtett logikai kapcsolatok. Ezek feltérképezése, és kihasználása növelheti a kategorizálás pontosságát. Dolgozatomban be fogok mutatni erre egy módszert, és értékelem annak eredményességét is.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.