Detail publikace
Vizuální segmentace elektronických dokumentů
modelování dokumentů, segmentace stránek, extrakce informace, struktura dokumentu
Segmentace dokumentů se zabývá detekcí vizuálního členění obsahu dokumentů a jeho reprezentací. Znalost členění obsahu umožňuje zpřesnit výsledky existujících metod zpracování dokumentů, které dosud využívaly zejména textový obsah dokumentu, jako například metody indexace a vyhledávání dokumentů, klasifikace, extrakce informace a další. V současnosti existuje několik přístupů k segmentaci dokumentů, které jsou však často omezené na konkrétní typ dokumentu či konkrétní aplikaci. V tomto příspěvku navrhujeme novou metodu, která odstraňuje některé omezující vlastnosti existujících metod a dále se zabýváme možností využití navržené metody segmentace v oblasti extrakce dat z dokumentu.
@INPROCEEDINGS{FITPUB8268, author = "Radek Burget", title = "Vizu\'{a}ln\'{i} segmentace elektronick\'{y}ch dokument\r{u}", pages = "155--166", booktitle = "Znalosti 2007", year = 2007, location = "Ostrava, CZ", publisher = "V\v{S}B - Technical University of Ostrava", ISBN = "978-80248-1279-3", language = "czech", url = "https://www.fit.vut.cz/research/publication/8268" }