Detail práce

Online nástroj pro rozpoznávání tabulek v obrázcích

Bakalářská práce Student: Inhliziian Bohdan Akademický rok: 2018/2019 Vedoucí: Herout Adam, prof. Ing., Ph.D.
Název anglicky
Online Tool for Recognition of Tables in Images
Jazyk práce
český
Abstrakt

Cilem teto prace je resit problem rozpoznavani tabulek v obrazcich a prevest vyfocenou tabulku, nahranou na webove rozhrani, do XLSX souboru. Program je vytvoreny s durazem na jednoduchost v pouziti potencialnim uzivatelem.

Pro detekce car byl pouzit algoritmus Probablistic Hough Transform a pomoci nastroju Tesseract byla provedena detekce textu v bunkach. Program byl umistneni na Amazon AWS a pristup k nemu webova aplikace dela pomoci API. Byl vytvoren vlastni algoritmus pro spojeni car do jedne cary a taky algoritmus pro odstraneni car, ktere nepatri do tabulky a chybne detekovanych car (text, sum).

Vytvorene reseni poskytuje moznost uzivatelum, ktere rucne prepisuji data z tabulek v dokumentech, knihach, vyuzit program, ktery dela vsechno automaticky, je potreba jen nahrat foto do webove aplikace.

Klíčová slova

Rozpoznavac tabulek, detekce tabulek, konverze tabulek, Hough Transform, detektor uhlu, extrakce textu z tabulek

Ústav
Studijní program
Informační technologie
Soubory
Stav
neobhájeno
Obhajoba
29. srpna 2019
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Komise shledala, že předložená práce nedosahuje minimální úrovně požadované pro bakalářské práce. Komise se rozhodla hodnotit práci jako nevyhovující "F".

Otázky u obhajoby
  1. Jak vypadá architektura neuronové sítě použité pro detekci rohů tabulky, jak jste měřil její úspěšnost?
  2. Jak je v aplikaci řešena situace, kdy je ve vstupním obrázku detekováno více míst pro jeden typ rohu, jako je tomu například na obrázku 4.4?
  3. Je v aplikaci řešena situace, kdy některý z rohů není vůbec detekován?
  4. Jak se aplikace zachová, pokud je na jednom obrázku více tabulek?
Komise
Růžička Richard, doc. Ing., Ph.D., MBA (UPSY FIT VUT), předseda
Dytrych Jaroslav, Ing., Ph.D. (UPGM FIT VUT), člen
Křena Bohuslav, Ing., Ph.D. (UITS FIT VUT), člen
Ryšavý Ondřej, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
INHLIZIIAN, Bohdan. Online nástroj pro rozpoznávání tabulek v obrázcích. Brno, 2019. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-08-29. Vedoucí práce Herout Adam. Dostupné z: https://www.fit.vut.cz/study/thesis/21683/
BibTeX
@bachelorsthesis{FITBT21683,
    author = "Bohdan Inhliziian",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Online n\'{a}stroj pro rozpozn\'{a}v\'{a}n\'{i} tabulek v obr\'{a}zc\'{i}ch",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/21683/"
}
Nahoru