Detail práce
Rozpoznávání historických textů pomocí hlubokých neuronových sítí
Táto práca sa zaoberá rozpoznávaním riadkov z historických textov. Historické texty pochádzajú z obdobia od 17. až 19 storočia a sú napísané pomocou fraktúry. Pri rozpoznávaní písma sa používa architektúra neurónovej siete zvaná sequence-to-sequence. Táto architektúra vychádza z modelu kodér-dekodér a používa mechanizmus attention. V rámci práce bola z textov, pochádzajúcich z archívu Deutsches Textarchiv, vytvorená dátová sada. Tento archív obsahuje 3 897 rôznych nemeckých diel, ku ktorým sú dostupné snímky strán a ich prepisy. Vytvorená dátová sada sa následne používa pri trénovaní a experimentovaní s neurónovou sieťou. V rámci experimentov sú skúmané rôzne modely konvolučných sietí, vplyv hyperparametrov siete a účinok pozičného kódovania na výsledky rozpoznávania. Výsledný model dokáže rozpoznať znaky s presnosťou 99,63 %. Prínosom tejto práce je spomínaná dátová sada a neurónová sieť, ktorá sa môže použivať pri rozpoznávaní historických dokumentov.
rozpoznávanie textu, historický text, neurónová sieť, OCR, konvolučná neurónová sieť, CNN, rekurentná neurónová sieť, RNN, seq2seq, kodér, dekodér, attention
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "A".
- Jak by jste v práci využil dostupný jazykový model?
- Jaký má vliv konstanta 10000 na rovnice pozičního kódování 3.23?
- Jakými mechanismy je možné pracovat s proměnlivou délkou sekvencí?
Drábek Vladimír, doc. Ing., CSc. (UPSY FIT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Rychlý Marek, RNDr., Ph.D. (UIFS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
@bachelorsthesis{FITBT21411, author = "Peter Ve\v{s}el\'{i}ny", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Rozpozn\'{a}v\'{a}n\'{i} historick\'{y}ch text\r{u} pomoc\'{i} hlubok\'{y}ch neuronov\'{y}ch s\'{i}t\'{i}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2019, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/21411/" }