Detail práce

Comic Images Super-Resolution Using Deep Learning

Bakalářská práce Student: Zdravecký Peter Akademický rok: 2021/2022 Vedoucí: Španěl Michal, Ing., Ph.D.
Název česky
Zvýšení rozlišení komiksových obrázků pomocí hlubokých neuronových sítí
Jazyk práce
anglický
Abstrakt

Táto práca demonštruje metódu super rozlíšenia na zlepšenie kvality komiksových obrázkov pomocou hlbokého učenia. Náročnou časťou tejto úlohy bolo súčasne zachovať kvalitu textových a kreslených častí, bez výraznej deformácie ktorejkoľvek časti z nich. Na dosiahnutie uspokojivých výsledkov boli skúmané dve hlboké neurónové siete. Sieť U-Net a modifikácia s názvom Robustný U-Net (RUNet). Zvolené stratové funkcie na trénovanie týchto sietí boli stredná kvadratická chyba a perceptuálna strata. Práca obsahuje experimenty na týchto sieťach v kombinácii s každou stratovou funkciou. Ďalšie experimenty sa zamerali na vplyv počtu použitých blokov zo stratovej siete VGG16 na funkciu perceptuálnej straty. Experimenty ukázali, že sieť RUNet využívajúca perceptuálnu stratu s tromi extrahovanými blokmi dosiahla najlepšie výsledky.

Klíčová slova

zvýšenie rozlíšenia obrazu, hlboké učenie, konvolučné neuronové siete, komiksové obrázky, U-Net, RUNet

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
14. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. Vstupní data s nízkým rozlišením často obsahují JPEG artefakty, váš degradační modul s ničím takovým ale nepočítá a tak se síť snaží rekonstruovat i artefakty. Jak by se výsledky změnily, kdybyste do degradačního modulu zahrnul JPEG kompresi?
  2. Jako perceptual loss se používá VGG síť předtrénovaná na datasetu s fotografiemi, které mají jiný charakter než komixy. Jaký efekt by mělo použití sítě trénované na komixech?
  3. Zkoumal jste jen zvýšení rozlišení s faktorem 2 a 4. Existují i metody pro zvyšování rozlišení s libovolným faktorem?
Komise
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), předseda
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
Citace
ZDRAVECKÝ, Peter. Comic Images Super-Resolution Using Deep Learning. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-14. Vedoucí práce Španěl Michal. Dostupné z: https://www.fit.vut.cz/study/thesis/24494/
BibTeX
@bachelorsthesis{FITBT24494,
    author = "Peter Zdraveck\'{y}",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Comic Images Super-Resolution Using Deep Learning",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/24494/"
}
Nahoru