Weboldal betöltés paraméterbecslés gépi tanulási módszerek segítségével

OData támogatás
Konzulens:
Dr. Molnár Sándor
Távközlési és Médiainformatikai Tanszék

A mai hálózatok túlterheltsége miatt az Internet szolgáltatóknak egyre fontosabb elemeznie, hogy a felhasználóik milyen minőségi paraméterekkel töltenek le tartalmakat. Mivel a szubjektív felhasználói élmény elemzése túl időigényes, ezért a gyakorlatban leginkább a forgalmi mintákból becsülhető kvantitatív adatokra hagyatkoznak.

Ez a módszer webböngészés esetén a HTTP protokoll működési elve miatt könnyen alkalmazható, hiszen minden egyes objektum külön folyamban töltődik le titkosítás használata nélkül. Azonban az elmúlt pár év trendjeinek köszönhetően megjelentek olyan protokollok is a böngészőkben, mint a SPDY (amiből a későbbi HTTP/2.0 protokoll is kialakult) illetve a QUIC. Ezen protokollok közös tulajdonsága, hogy a web objektumokat egyetlen multiplexált folyamban tölti le titkosított csatorna fölött, így megnehezedik a weboldal betöltési idők becslése a forgalmi minták alapján.

Ennek megfelelően a hagyományos elemzési módszerek egyre kevésbé tudják tartani a lépést a folyamatosan változó webes forgalommal, így a kutatók a sok területen sikerrel alkalmazott gépi tanulási módszerek felé fordultak. A gépi tanulási módszerek előnye, hogy használatukkal akkora adathalmaz feldolgozására nyílik lehetőségünk, amelyet klasszikus módszerekkel szinte lehetetlen lenne kezelnünk. Ezek a különböző algoritmusok már bizonyítottan alkalmasak videó nézés közbeni QoE (Quality of Experience) mérésre és hálózati forgalom azonosítására. Ezen kutatások alapján úgy gondolom, hogy a gépi tanuló algoritmusok sikerrel alkalmazhatók oldal betöltési idők előrejelzésére is.

A diplomamunkában bemutatom az általam fejlesztett mikrokörnyezetet, amelyben Google Chrome-mal böngészve weboldalak hálózati paramétereit tudjuk mérni és hozzárendelni forgalmi mintákhoz. Az így kapott hálózati paraméter és forgalmi minta párosból létrehoztam egy saját adatbázist, amelyet gépi tanuló algoritmusokkal elemeztem. A betanított algoritmus már alkalmas egy web letöltésfolyam első néhány csomagjának paraméterei alapján megbecsülni, hogy az adott felhasználó elégedett-e a weboldal betöltési sebességével. A létrehozott keretrendszer másik nagy előnye, hogy a gépi tanulásnak köszönhetően már azelőtt rendelkezésünkre állhatnak a szükséges adatok, hogy a weboldal betöltése valójában befejeződött volna, ugyanis az elemzéshez nincs szükségünk az adott folyamban lévő csomagok összességére.

Az elkészült keretrendszerrel a szolgáltatók a felhasználó közreműködése nélkül juthatnak információhoz a hálózati paraméterekről, így a lehetséges problémáról hamarabb értesülnek, illetve a többlet információt felhasználhatják a hálózat optimalizálásához.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.