Természetes nyelvű szövegek gépi osztályozása

OData támogatás
Konzulens:
Dr. Mihajlik Péter
Távközlési és Médiainformatikai Tanszék

A dolgozatomban az automatikus híváskiszolgálás egyik fontos lépésével, a beszédfelismerők által leiratozott szöveg osztályozásával foglalkozom. Áttekintem a teljes klasszifikációs folyamatot: vizsgálom az egyes jellemző generáló, és szelektáló módszereket, ismertetem, és összevetem a statisztikai osztályozó típusokat.

Az elméleti alapok felvázolása után egy konkrét adathalmazra alkalmazom a bemutatott módszereket: felépítek egy naiv Bayes-, egy többrétegű perceptron és egy LSTM háló alapú osztályozót. Ezek eredményeit elemzem, majd megvizsgálom a továbbfejlesztési lehetőségeket.

A többrétegű perceptron alapú osztályozó, és a hozzá kapcsolódó feldolgozó struktúra már alkalmas az éles környezetben való használatra is. A kapott pontosság alapján valószínűleg felhasználóbarátabb, kényelmesebben kezelhető, és gyorsabb szolgáltatást lehet vele nyújtani, mint a jelenleg a telefonközpontokban működő menürendszerekkel, mivel a felhasználó élő beszédben mondhatja el a problémáját, és nem kell végighallgatnia, és végigjárnia az opciókat.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.