Detail práce
Detekce jógových pozic v obraze
Motivací pro tuto práci je koncept mobilní aplikace detekující jógové pozice a zobrazující výsledky uživateli. Cílem této práce je ověření hypotézy, že i jednoduchý model konvoluční neuronové sítě dokáže rozpoznávat a klasifikovat snímky z nahraných jógových sekvencí. Napsal jsem aplikaci, v níž se pořízená videa ručně oanotují. Výsledná data, sestávající ze snímků extrahovaných ze 162 jógových videí na základě jednotlivých anotací, jsou pak použita k trénování modelu sítě. Vytvořený Dataset obsahuje 22 000 obrázků reprezentující 22 různých jógových pozic. Snímky jsou z videí extrahovány pomocí knihovny OpenCV, trénování modelu je plně v režii platformy TensorFlow a API Keras, a výsledky jsou vizualizovány pomocí nástroje TensorBoard. Přesnost modelu detekovat jógové pozice dosahuje 91% při použití aktivační funkce sigmoid a binary cross-entropy loss function. I přes slibně vypadající dosažené výsledky jsou hlavním přínosem této práce nástroje pro tvorbu datasetu a vytvořený Dataset samotný. Díky nim byla navrhovaná hypotéza úspěšně ověřena.
Detekce jógových pozic v obraze, Aplikace na anotování videí, Trénování konvoluční neuronové sítě pro rozpoznávání jógových pozic
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Kde jste prováděl trénování navržených sítí? Bylo vyzkoušeno velké množství variant a na vlastní PC by to patrně trvalo neúměrně dlouho. V práci tahle skutečnost nebyla zmíněna.
- Uvažoval jste nad využitím detekce kostry člověka, jak bylo navrženo v zadání práce?
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT24128, author = "Ji\v{r}\'{i} Kut\'{a}lek", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Detekce j\'{o}gov\'{y}ch pozic v obraze", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2021, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/24128/" }