Detail publikace

Vizuální segmentace elektronických dokumentů

BURGET Radek. Vizuální segmentace elektronických dokumentů. In: Znalosti 2007. Ostrava: VŠB - Technická univerzita Ostrava, 2007, s. 155-166. ISBN 978-80248-1279-3.
Název anglicky
Visual Document Segmentation
Typ
článek ve sborníku konference
Jazyk
čeština
Autoři
Klíčová slova

modelování dokumentů, segmentace stránek, extrakce informace, struktura dokumentu

Abstrakt

Segmentace dokumentů se zabývá detekcí vizuálního členění obsahu dokumentů a jeho reprezentací. Znalost členění obsahu umožňuje zpřesnit výsledky existujících metod zpracování dokumentů, které dosud využívaly zejména textový obsah dokumentu, jako například metody indexace a vyhledávání dokumentů, klasifikace, extrakce informace a další. V současnosti existuje několik přístupů k segmentaci dokumentů, které jsou však často omezené na konkrétní typ dokumentu či konkrétní aplikaci. V tomto příspěvku navrhujeme novou metodu, která odstraňuje některé omezující vlastnosti existujících metod a dále se zabýváme možností využití navržené metody segmentace v oblasti extrakce dat z dokumentu.

Rok
2007
Strany
155-166
Sborník
Znalosti 2007
Konference
Znalosti 2007, Ostrava, CZ
ISBN
978-80248-1279-3
Vydavatel
VŠB - Technická univerzita Ostrava
Místo
Ostrava, CZ
BibTeX
@INPROCEEDINGS{FITPUB8268,
   author = "Radek Burget",
   title = "Vizu\'{a}ln\'{i} segmentace elektronick\'{y}ch dokument\r{u}",
   pages = "155--166",
   booktitle = "Znalosti 2007",
   year = 2007,
   location = "Ostrava, CZ",
   publisher = "V\v{S}B - Technical University of Ostrava",
   ISBN = "978-80248-1279-3",
   language = "czech",
   url = "https://www.fit.vut.cz/research/publication/8268"
}
Nahoru