Távközlési szolgáltató előfizetőinek adatbányászata SAS környezetben

OData támogatás
Konzulens:
Gáspár Csaba
Távközlési és Médiainformatikai Tanszék

Manapság szinte minden otthonban találkozhatunk valamilyen telekommunikációs vagy tartalomszolgáltatással, melyek előfizetéshez és szolgáltatóhoz kötődnek. Az igénybe vett szolgáltatások forgalmat generálnak az adott hálózaton, melynek paramétereit rögzítik a szolgáltató oldalán. Az így keletkezett részletes és nagy mennyiségű adatokat részben számlázásra használják, részben további elemzéseket végeznek rajta. Ezen elemzések célja lehet egyszerű statisztikák összeállítása, de akár bonyolultabb összefüggések feltárása is, gondolok itt lemorzsolódás elemzésre vagy akár ügyfélérték számításra.

Egy szolgáltató pontos információkkal csak az előfizetői végpontig rendelkezik, hiszen addig tart a hálózata, de arról már nincs információja, hogy hányan használják az adott szolgáltatást a végponton. Hiába vannak adatai az előfizetőről, ezekből sokszor nem lehet következtetni a felhasználók számára. Egy egyszerű példa erre egy albérlet, ahol egyetemisták laknak, de a szolgáltatások a főbérlőhöz kötődnek, aki nem is használja azokat. Dolgozatomban egy olyan algoritmust mutatok be, megpróbálja megbecsülni egy ilyen végpontról, hogy azt egy vagy több személy használja. Megadom a formális leírását, majd egy konkrét példa kapcsán bemutatom a működését és az eredményeket. Ehhez egy távközlési szolgáltató hívásadatait használom fel, majd az algoritmus és valamilyen adatbányászati modell segítségével próbálom megbecsülni egy előfizetésről, hogy azt egy vagy több személy használja.

A végső modellt egy független adathalmazon tesztelem és értékelem Végezetül összegzem a tapasztalatokat és javaslatot teszek az esetleges módosításokra, továbbfejlesztésre és felhasználásra.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.