Dokumentum osztályozás adatbányászati módszerekkel

OData támogatás
Konzulens:
Nagy Gábor
Távközlési és Médiainformatikai Tanszék

Feladatom során egy webes alkalmazást alapjait készítettem el, mely képes internetes hírportálok tartalmát feldolgozni.

A webalkalmazás adat- és szövegbányászati eszközöket felhasználva, alkalmas az index.hu portál RSS hírfolyamának felolvasására, tárolására. A felhasználó által megadott szöveget képes a hírfolyam korábbi cikk kategóriáinak egyikébe besorolni, kizárólag a szöveg tartalma alapján.

A feladat megvalósításának érdekében megismerkedtem a webalkalmazások működési elvével. Elsajátítottam a Python nyelv ismeretét, megismertem a Django webes keretrendszer használatát. Korábbi tanulmányaim alatt elért eredményeimet felhasználva automatikus adatbányászati folyamatokat implementáltam, melyeket integráltam a webalkalmazásba.

A webes felületen keresztül lehetősége van a felhasználónak irányítani a hírportál felolvasását, illetve képes saját szöveg megadására is. A keretrendszerbe integrált adat- és szövegbányászati eljárások, web-crawler technológiák és megjelenítő eszközök segítségével, webes felületen, külső beavatkozás nélkül képes az adatok feldolgozására, eredmények közlésére.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.