Logó keresés kép típusú nagy adathalmazokban

OData támogatás
Konzulens:
Dr. Szűcs Gábor
Távközlési és Médiainformatikai Tanszék

A különböző vállalatok, termékek logóinak megjelenése nagyon fontos terület a mai marketingen alapuló világban. Az egyre nagyobb mértékben előállított vizuális tartalmakban, legyen szó akár fizetett televíziós, internetes reklámokról, vagy a népszerű szociális médiáról, ahol a felhasználók saját maguk által készített tartalmak révén indirekt módon is oszthatnak meg ismert logókat, a cégek számára is jelentős tudással bír, hogy a termékeik milyen helyeken, mennyi ideig láthatók, hiszen ezek az adatok közvetlenül hozzájárulhatnak a bevételek, költségek alakításához.

A dolgozatomban egy olyan kép elemző és osztályozó rendszert készítettem, amely egy tanulóállomány alapján felépít egy osztályozó programot, amivel eldönthető, hogy az adott bemeneti képen milyen logó található. Ehhez szükséges a képek tartalmi információt kinyerni és felhasználni. Bemutatom az elemzés módszerét, amiben olyan már jól ismert és széles körben használt algoritmusokat használok fel, mint a SIFT, az osztályozáshoz pedig a C-SVC osztályozó.

A tanuláshoz és teszteléshez egy a Flickr-ről összegyűjtott adathalmazt használok, amiben 27 különböző márka logóit tartalmazó képek annotálva állnak rendelkezésre. Ezt felhasználva értékelem a rendszerem teljesítményét különböző szempontok alapján.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.