Detail práce
Comic Images Super-Resolution Using Deep Learning
Táto práca demonštruje metódu super rozlíšenia na zlepšenie kvality komiksových obrázkov pomocou hlbokého učenia. Náročnou časťou tejto úlohy bolo súčasne zachovať kvalitu textových a kreslených častí, bez výraznej deformácie ktorejkoľvek časti z nich. Na dosiahnutie uspokojivých výsledkov boli skúmané dve hlboké neurónové siete. Sieť U-Net a modifikácia s názvom Robustný U-Net (RUNet). Zvolené stratové funkcie na trénovanie týchto sietí boli stredná kvadratická chyba a perceptuálna strata. Práca obsahuje experimenty na týchto sieťach v kombinácii s každou stratovou funkciou. Ďalšie experimenty sa zamerali na vplyv počtu použitých blokov zo stratovej siete VGG16 na funkciu perceptuálnej straty. Experimenty ukázali, že sieť RUNet využívajúca perceptuálnu stratu s tromi extrahovanými blokmi dosiahla najlepšie výsledky.
zvýšenie rozlíšenia obrazu, hlboké učenie, konvolučné neuronové siete, komiksové obrázky, U-Net, RUNet
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Vstupní data s nízkým rozlišením často obsahují JPEG artefakty, váš degradační modul s ničím takovým ale nepočítá a tak se síť snaží rekonstruovat i artefakty. Jak by se výsledky změnily, kdybyste do degradačního modulu zahrnul JPEG kompresi?
- Jako perceptual loss se používá VGG síť předtrénovaná na datasetu s fotografiemi, které mají jiný charakter než komixy. Jaký efekt by mělo použití sítě trénované na komixech?
- Zkoumal jste jen zvýšení rozlišení s faktorem 2 a 4. Existují i metody pro zvyšování rozlišení s libovolným faktorem?
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT24494, author = "Peter Zdraveck\'{y}", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Comic Images Super-Resolution Using Deep Learning", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2022, location = "Brno, CZ", language = "english", url = "https://www.fit.vut.cz/study/thesis/24494/" }