Detail práce

Rozpoznávání historických textů pomocí hlubokých neuronových sítí

Bakalářská práce Student: Vešelíny Peter Akademický rok: 2018/2019 Vedoucí: Kišš Martin, Ing.
Název anglicky
Convolutional Networks for Historic Text Recognition
Jazyk práce
český
Abstrakt

Táto práca sa zaoberá rozpoznávaním riadkov z historických textov. Historické texty pochádzajú z obdobia od 17. až 19 storočia a sú napísané pomocou fraktúry. Pri rozpoznávaní písma sa používa architektúra neurónovej siete zvaná sequence-to-sequence. Táto architektúra vychádza z modelu kodér-dekodér a používa mechanizmus attention. V rámci práce bola z textov, pochádzajúcich z archívu Deutsches Textarchiv, vytvorená dátová sada. Tento archív obsahuje 3 897 rôznych nemeckých diel, ku ktorým sú dostupné snímky strán a ich prepisy. Vytvorená dátová sada sa následne používa pri trénovaní a experimentovaní s neurónovou sieťou. V rámci experimentov sú skúmané rôzne modely konvolučných sietí, vplyv hyperparametrov siete a účinok pozičného kódovania na výsledky rozpoznávania. Výsledný model dokáže rozpoznať znaky s presnosťou 99,63 %. Prínosom tejto práce je spomínaná dátová sada a neurónová sieť, ktorá sa môže použivať pri rozpoznávaní historických dokumentov.

Klíčová slova

rozpoznávanie textu, historický text, neurónová sieť, OCR, konvolučná neurónová sieť, CNN, rekurentná neurónová sieť, RNN, seq2seq, kodér, dekodér, attention

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
13. června 2019
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "A".

Otázky u obhajoby
  1. Jak by jste v práci využil dostupný jazykový model?
  2. Jaký má vliv konstanta 10000 na rovnice pozičního kódování 3.23?
  3. Jakými mechanismy je možné pracovat s proměnlivou délkou sekvencí?
Komise
Herout Adam, prof. Ing., Ph.D. (UPGM FIT VUT), předseda
Drábek Vladimír, doc. Ing., CSc. (UPSY FIT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Rychlý Marek, RNDr., Ph.D. (UIFS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
VEŠELÍNY, Peter. Rozpoznávání historických textů pomocí hlubokých neuronových sítí. Brno, 2019. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-13. Vedoucí práce Kišš Martin. Dostupné z: https://www.fit.vut.cz/study/thesis/21411/
BibTeX
@bachelorsthesis{FITBT21411,
    author = "Peter Ve\v{s}el\'{i}ny",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Rozpozn\'{a}v\'{a}n\'{i} historick\'{y}ch text\r{u} pomoc\'{i} hlubok\'{y}ch neuronov\'{y}ch s\'{i}t\'{i}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/21411/"
}
Nahoru