Detail práce

Zvyšování konzistence v datových sadách pro rozpoznávání textu

Bakalářská práce Student: Tvarožný Matúš Akademický rok: 2021/2022 Vedoucí: Kišš Martin, Ing.
Název anglicky
Improving Consistency in Text Recognition Datasets
Jazyk práce
český
Abstrakt

Táto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu.

Klíčová slova

rozpoznávanie textu, OCR, HTR, neurónové siete, NN, konvolučné neurónové siete, CNN, rekurentné neurónové siete, RNN, sequence to sequence, se2seq, CTC, konzistencia, dátové sady

Ústav
Studijní program
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
14. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Otázky u obhajoby
  1. Máte odhad skutečné chybovosti přepisů v použité datové sadě?
  2. Jak ovlivňuje detekci chybných přepisů fakt, že využíváte neuronovou síť, která byla na těchto přepisech trénována?
  3. Jestli to chápu dobře, výsledky Tabulky 6.3 jsou na řádcích již filtrovaných na rozdílnosti výstupů neuronové sítě vůči přepisům. Jak tento fakt ovlivňuje interpretaci těchto výsledků.
Komise
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), předseda
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Martínek Tomáš, Ing., Ph.D. (UPSY FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
Citace
TVAROŽNÝ, Matúš. Zvyšování konzistence v datových sadách pro rozpoznávání textu. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-14. Vedoucí práce Kišš Martin. Dostupné z: https://www.fit.vut.cz/study/thesis/25170/
BibTeX
@bachelorsthesis{FITBT25170,
    author = "Mat\'{u}\v{s} Tvaro\v{z}n\'{y}",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Zvy\v{s}ov\'{a}n\'{i} konzistence v datov\'{y}ch sad\'{a}ch pro rozpozn\'{a}v\'{a}n\'{i} textu",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/25170/"
}
Nahoru