Detail práce
Online nástroj pro rozpoznávání tabulek v obrázcích
Cilem teto prace je resit problem rozpoznavani tabulek v obrazcich a prevest vyfocenou tabulku, nahranou na webove rozhrani, do XLSX souboru. Program je vytvoreny s durazem na jednoduchost v pouziti potencialnim uzivatelem.
Pro detekce car byl pouzit algoritmus Probablistic Hough Transform a pomoci nastroju Tesseract byla provedena detekce textu v bunkach. Program byl umistneni na Amazon AWS a pristup k nemu webova aplikace dela pomoci API. Byl vytvoren vlastni algoritmus pro spojeni car do jedne cary a taky algoritmus pro odstraneni car, ktere nepatri do tabulky a chybne detekovanych car (text, sum).
Vytvorene reseni poskytuje moznost uzivatelum, ktere rucne prepisuji data z tabulek v dokumentech, knihach, vyuzit program, ktery dela vsechno automaticky, je potreba jen nahrat foto do webove aplikace.
Rozpoznavac tabulek, detekce tabulek, konverze tabulek, Hough Transform, detektor uhlu, extrakce textu z tabulek
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Komise shledala, že předložená práce nedosahuje minimální úrovně požadované pro bakalářské práce. Komise se rozhodla hodnotit práci jako nevyhovující "F".
- Jak vypadá architektura neuronové sítě použité pro detekci rohů tabulky, jak jste měřil její úspěšnost?
- Jak je v aplikaci řešena situace, kdy je ve vstupním obrázku detekováno více míst pro jeden typ rohu, jako je tomu například na obrázku 4.4?
- Je v aplikaci řešena situace, kdy některý z rohů není vůbec detekován?
- Jak se aplikace zachová, pokud je na jednom obrázku více tabulek?
Dytrych Jaroslav, Ing., Ph.D. (UPGM FIT VUT), člen
Křena Bohuslav, Ing., Ph.D. (UITS FIT VUT), člen
Ryšavý Ondřej, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
@bachelorsthesis{FITBT21683, author = "Bohdan Inhliziian", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Online n\'{a}stroj pro rozpozn\'{a}v\'{a}n\'{i} tabulek v obr\'{a}zc\'{i}ch", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2019, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/21683/" }