Detail práce
Detekce dopravních prostředků v obraze a videu
Cílem této práce je porovnání dostupných vícetřídních detektorů při detekci silničních vozidel na vhodně vytvořené datové sadě. Jako vícetřídní detektory byly vybrány neuronové sítě určené k detekci a klasifikaci objektů v obraze. Experimentováno je s detektory Mask R-CNN, YOLOv4 a YOLACT++, které jsou v práci popsány. Výběr detektorů zastupuje různé architektury a přístupy k detekci. Pro účely učení a testování je v práci detailně popsána vytvořená datová sada a její parametry. Detekce je testována na obraze z běžného silničního provozu a samostatně na částečně překrytých objektech. Výsledkem práce je znovupoužitelná a rozšířitelné datová sada, naměřené výsledky dosažené při detekci a jejich hlubší rozbor.
detekce objektů, hluboké učení, konvoluční neuronové sítě, Mask R-CNN, YOLOv4, YOLACT++, střední průměrná přesnost
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.
- Dává opravdu smysl pracovat s kategoriemi vozidel jako s objekty různého typu? Proč? Jak by bylo možné úlohu realizovat jiným způsobem?
- Z uvedených experimentů nelze jednoduše zjistit kolik vozidel v provozu skutečně správně zachytíte (detekujete, aniž by vás zajímala kategorie). Jaká je precision-recall charakteristika vašich detekčních modelů?
- Jaká je chyba klasifikace a matice záměn vašich klasifikátorů? Zde mě zajímají hodnoty pro všechny správně detekovaná vozidla (bez těžkých instancí). Toto v experimentech chybí.
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT24138, author = "Dalimil Rozpr\'{y}m", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Detekce dopravn\'{i}ch prost\v{r}edk\r{u} v obraze a videu", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2021, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/24138/" }