Gyors mozgás előrejelzése videofelvételeken

OData támogatás
Konzulens:
Dr. Kovács Gábor
Távközlési és Médiainformatikai Tanszék

A multimédiás technológiák széleskörű felhasználása a videofeldolgozás számos alkalmazásának ad lehetőséget, aminek egy fontos területe a mozgás detektálása. A nagyfelbontású videók feldolgozása azonban igen sok erőforrást igényelne. Ha viszont tudjuk, hogy a következő képkockán hol kell keresnünk a mozgó tárgyat, a vizsgálandó területet leszűkíthetjük, így az erőforrásokkal jelentősen spórolhatunk.

A szakdolgozatom célja egy potenciálisan gyorsan mozgó objektum követésének megvalósítása videofelvételen, valamint annak vizsgálata, hogy adható-e előrejelzés az objektum következő pozíciójára. A dolgozatban áttekintettem az objektumkövetés és a mozgáspredikció néhány alapvető módszerét, majd létrehoztam az ezeket implementáló programokat OpenCV-Python felhasználásával. Az előrejelzés célja az volt, hogy az objektum következő képkockán lévő koordinátáira becslést adjak, ezzel leszűkítve a területet, ahol azt keresni kell.

Az implementációhoz egyszerű visszacsatolt neurális hálózatokat, az Elman és Jordan hálózatokat használtam. Ezeket a teljes felvétel egy kisebb részével tanítottam, ezután egy másik részével teszteltem a működésüket. Teszteléskor a hálózatok eredményeiről hibaszámítást készítettem, ezek alapján a kettőt összehasonlítottam.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.