Adatbányászat és ajánlás szolgáltatások vizsgálata: nyílt forráskódú megoldások skálázható architektúrán

OData támogatás
Konzulens:
Dr. Ekler Péter
Automatizálási és Alkalmazott Informatikai Tanszék

Rendszereink napról napra egyre több adatott gyűjtenek össze, de a gyakorlatban az adatnak önmagábban csekély értéke van, az alkalmazások számára az adathalmaz mögött rejlő információk, trendek, kiugró jelenségek a kulcsfontosságúak és érdekesek. Az ilyen információk felderítése, azonosítása és jellemzése az adatbányászat fő feladata.

Az adatokból az információ kinyerésig az út viszont gyakran nehézkes és hosszas. Meg kell oldani olyan problémákat mint például az adat eltárolása, strukturálása, adatmennyiség csökkentése (zajszűrés, mintavételezés), transzformációja, több algoritmus kipróbálása, majd ezek értelmezése és értékelése. Ez a probléma az utóbbi évtizedben adatmennyiség nagyságrendbeli növekedése miatt csak tovább fokozódott.

Ugyanakkor egyre inkább teret hódítanak a nyílt forráskódú megoldások. Ezek közismert problémákat oldanak meg, bevonva az érdeklődök minél nagyobb körét és kihasználva a közösségben rejlő erőt. Ilyen például az elosztott adattárolás és feldolgozás platformot szolgáló Apache Hadoop és Hbase. Az adatbányászat területén ezt főleg az Apache Mahout jelenti, amely épít a már említett technológiákra.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.