Detail práce

Rekonstrukce nekvalitních snímků obličejů

Diplomová práce Student: Bako Matúš Akademický rok: 2019/2020 Vedoucí: Hradiš Michal, Ing., Ph.D.
Jazyk práce
slovenský
Abstrakt

V tejto diplomovej práci sa venujem superrezolúcii obrázkov tvárí pomocou konvolučných neurónových sietí so zameraním na zachovanie identity. Ako riešenie problému navrhujem metódu pozostávajúcu z architektúry DPNet a spôsobu trénovania, ktorá vychádza z moderných metód superrezolúcie pomocou neurónových sietí. Model architektúry DPNet je trénovaný na dátovej sade Flickr-Faces-HQ, kde pri štvornásobnom zväčšení dosahuje hodnotu SSIM 0.856, pričom najlepšia z vybraných moderných architektúr, nazývaná Residual channel attention network, dosahuje po natrénovaní hodnotu 0.858. Pri trénovaní modelov pomocou adversariálnej chyby sa v obrázkoch objavovali rôzne artefakty, pričom som experimentoval s viacerými metódami pre ich odstránenie, čo zatiaľ neviedlo k zlepšeniu. Pre porovnanie hodnotenia kvality s ľudským vnímaním som vyhodnotil dotazník, kde sú obrázky zoradené podľa kvality. Výsledky ukazujú, že navrhnutá architektúra sa kvalitou približuje najnovším metódam.

Klíčová slova

superrezolúcia, počítačové videnie, neurónové siete, rekonštrukcia obrázkov

Ústav
Studijní program
Informační technologie, obor Inteligentní systémy
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
14. července 2020
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Otázky u obhajoby
  1. Na str. 30 píšete: "Počas implementácie modelov CARN2, DBPN3, DRCN4 a RCAN5 som sa inšpiroval už existujúcimi implementáciami." Co v této větě znamená slovo "inspiroval"?
  2. Čím si vysvětlujete, že použití diskriminátoru v duchu GAN výsledky pouze zhoršilo? Podle literatury i z logiky věci by mělo výsledky zlepšit.
  3. Podle grafů z obr. 6.8 neuronová síť produkuje z hlediska rozpoznávání identity spíše horší než "tupá" bikubická interpolace. Čím si to vysvětlit?
  4. Co přesně klasifikujete v rámci práce?
  5. Trénoval jste síť vždy na zvýšení rozlišení obrázku?
  6. Zkoušel jste práci na něco jiného, než obličeje?
Komise
Rogalewicz Adam, doc. Mgr., Ph.D. (UITS FIT VUT), předseda
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Hrubý Martin, Ing., Ph.D. (UITS FIT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Citace
BAKO, Matúš. Rekonstrukce nekvalitních snímků obličejů. Brno, 2020. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2020-07-14. Vedoucí práce Hradiš Michal. Dostupné z: https://www.fit.vut.cz/study/thesis/23003/
BibTeX
@mastersthesis{FITMT23003,
    author = "Mat\'{u}\v{s} Bako",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Rekonstrukce nekvalitn\'{i}ch sn\'{i}mk\r{u} obli\v{c}ej\r{u}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2020,
    location = "Brno, CZ",
    language = "slovak",
    url = "https://www.fit.vut.cz/study/thesis/23003/"
}
Nahoru