Detail práce

Analýza rozložení textu v historických dokumentech

Diplomová práce Student: Palacková Bianca Akademický rok: 2020/2021 Vedoucí: Kodym Oldřich, Ing., Ph.D.
Název anglicky
Text Layout Analysis in Historical Documents
Jazyk práce
český
Abstrakt

Cieľom tejto diplomovej práce je navrhnúť a implementovať algoritmus na analýzu rozloženia textu v historických dokumentoch. Pri riešení tohto problému bola využitá neurónová sieť, konkrétne architektúra Faster-RCNN. Na trénovanie a otestovanie algortimu bol využitý dataset so 6 135 obrázkami dobových novín. V rámci práce boli natrénované 4 modely neurónových sietí: model na detekciu slov, nadpisov, textových regiónov a model detekujúci slová na základe ich polohy v riadku. Výstupy z týchto sietí boli vhodne spracované, s cieľom detekovať rozloženie textu na vstupnom obrázku. Na evaluáciu bola použitá upravená metrika F-score, na základe ktorej algoritmus dosiahol presnosť takmer 80 %. 

Klíčová slova

analýza rozloženia textu v dokumentoch, neurónové siete, Faster-RCNN, Python, spracovanie obrazu

Ústav
Studijní program
Informační technologie a umělá inteligence, specializace Počítačové vidění
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
24. června 2021
Oponent
Průběh obhajoby

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B.

Otázky u obhajoby
  1. Detekce odstavců se trénuje a vyhodnocuje na celých snímcích? Jaké je rozlišení?
  2. Jak dobře systém funguje v porovnání s něčím existujícím (Transkribus, PERO, ABBYY, Tesseract)?
  3. Jak jsou velká slova vůči rozlišení výstupu backbone sítě?
  4. Využila jste předtrénovanou síť?
Komise
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), předseda
Bařina David, Ing., Ph.D. (UPGM FIT VUT), člen
Beran Vítězslav, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Herout Adam, prof. Ing., Ph.D. (UPGM FIT VUT), člen
Lengál Ondřej, Ing., Ph.D. (UITS FIT VUT), člen
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), člen
Citace
PALACKOVÁ, Bianca. Analýza rozložení textu v historických dokumentech. Brno, 2021. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2021-06-24. Vedoucí práce Kodym Oldřich. Dostupné z: https://www.fit.vut.cz/study/thesis/23653/
BibTeX
@mastersthesis{FITMT23653,
    author = "Bianca Palackov\'{a}",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Anal\'{y}za rozlo\v{z}en\'{i} textu v historick\'{y}ch dokumentech",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2021,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/23653/"
}
Nahoru