Detail práce
Counting Crates in Images
V této práci se zabývám tématem počítání beden v obrazových datech pomocí technik hlubokého učení. V práci jsem navrhl řešení pro počítání beden, které představuji na fotkách krabiček sirek. Ačkoli původní řešení počítalo s využitím datové sady beden ze skladu pivovaru, sada nakonec nebyla dodána a na doporučení vedoucího práce byly pro řešení vybrány bloky krabiček sirek. Implementované řešení využívá plně konvoluční neuronovou síť založenou na klasifikaci, umožňující výstup ve vysokém rozlišení. Tato síť je trénována na výřezech fotek z datové sady, díky čemuž je řešení rychlé a síť je vhodná i pro použití na menších datových sadách. Síť detekuje ve fotkách klíčové body krabiček sirek, které jsou následně zpracovány algoritmem pro odhad klíčových bodů z predikce sítě a výpočet finálního počtu beden. Na validačním datasetu dosahuje řešení následujících výsledků: ve 12,5 % případů predikce selže a ve zbylých případech má průměrnou absolutní odchylku (MAE) 11,14. Pomocí rozsáhlých experimentů bylo řešení vyhodnoceno a výsledky potvrzují, že tento přístup může být použit pro počítání objektů.
zpracování obrazu, konvoluční neuronové sítě, detekce klíčových bodů, počítání objektů
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.
- Jaké kroky při počítání objektů by bylo potřeba přidat / upravit, aby nedocházelo ke zbytečnému ignorování objektů s detekovanými sekundárními klíčovými body, pokud bude chybět některý z primárních (okrajových) bodů objektů?
- Dokázala by aplikace těžit z kontinuálního videa?
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT24020, author = "Petr Mi\v{c}ulek", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Counting Crates in Images", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2021, location = "Brno, CZ", language = "english", url = "https://www.fit.vut.cz/study/thesis/24020/" }