Felhasználói visszajelzés alapú döntéstámogatás félstruktrukturált adatok elemzésével

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

Bizonyos döntési helyzetekben a döntéshozónak akár több száz, szöveges formátumban elérhető alternatíva közül kell kiválasztania a legjobbat (nem pusztán egyet a jók közül). Ezek közé tartozik például a legjobb munkavállaló vagy állás, a legjobb ingatlan vagy az ideális társ megtalálása.

Diplomamunkám keretében a feladatom egy ilyen döntési szituációkat támogató keretrendszer kidolgozása volt, active learning és gépi tanulási technikák felhasználásával, annak érdekében, hogy az intelligens rendezésnek köszönhetően a döntéshozónak a lehető legkevesebb dokumentumot kelljen átnéznie, mielőtt a legutolsó jó alternatívához is elér. A felhasználói visszajelzés gyűjtése és integrálása minden megjelenített dokumentum után a modell finomítását, előrejelző képességének javítását szolgálja.

A diplomamunka elkészítése során áttekintettem a szakirodalmat, példa adathalmazokat (önéletrajzokat) gyűjtöttem és létrehoztam egy prototípus rendszert. Meg kellett oldanom a felhasználói visszajelzés modellezését és meg kellett határozni a teljesítményértékelés szempontjait is. Szintén fontos volt, hogy az alkalmazott algoritmus gyorsan, a felhasználót meg nem várakoztatva működjön.

Szövegbányászati technikákkal dolgoztam és kezdetben egy nagyon egyszerű modellt hoztam létre. Ezután fokozatosan bővítettem azt adatfeldolgozási lépésekkel (szótövezéssel, dimenziócsökkentéssel), különféle algoritmusokkal kísérleteztem, majd az adatokhoz és a feladat jellegéhez igazított active learning technikákat is kipróbáltam.

Az eredmények tükrében azt állapítottam meg, hogy a legjobbnak bizonyuló modell jól teljesít az ígéretes dokumentumok nagy részének korai azonosításában (magas recall érték), és sebessége is megfelelő. További finomításra és tesztelésre szorul azonban annak érdekében, hogy a legutolsó jó dokumentumot is viszonylag korán azonosítani tudjuk, és így a döntéshozó által átnézendő dokumentumok száma ténylegesen lecsökkenjen.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.