Result Details

Klasifikace prvků dokumentu na základě vizuálních rysů

KUNC, M.; BURGET, R. Klasifikace prvků dokumentu na základě vizuálních rysů. Znalosti 2008. Bratislava: Vydavateľstvo STU, 2008. s. 347-350. ISBN: 978-80-227-2827-0.
English title
Document Element Classification Based on Visual Features
Type
conference paper
Language
Czech
Authors
Kunc Michael, Ing., DIFS (FIT)
Burget Radek, doc. Ing., Ph.D., DIFS (FIT)
Abstract

Příspěvek se zabývá vizuální segmentací webových stránek a následnou klasifikací detekovaných oblastí na základě jejich vizuálních vlastností. Segmentace, tedy detekce vizuálního členění stránky, je založena na bottom-up analýze stránky společně s analýzou vizuálně významných prvků a jejím výsledkem je model vizuálního členění zpracovávaného dokumentu. Samotná klasifikace potom využívá informace o vzájemné poloze oblastí a jejich vizuálních vlastnostech, které jsou v tomto modelu obsaženy.Příspěvek se dále zbývá experimentálním porovnáním dvou klasifikačních algoritmů pro daný účel na různých množinách dat.

English abstract

This paper deals with the visual segmentation of web documents and subsequent classification of the detected areas based on their visual attributes such as the mutual area positions, font properties and colors. We present an experimental evaluation of two classification algorithm for different data sets.

Keywords

klasifikace dokumentů, vizuální informace, segmentace

English keywords

document classification, visual information, segmentation

Published
2008
Pages
347–350
Proceedings
Znalosti 2008
Conference
Znalosti 2008
ISBN
978-80-227-2827-0
Publisher
Vydavateľstvo STU
Place
Bratislava
BibTeX
@inproceedings{BUT27763,
  author="Michael {Kunc} and Radek {Burget}",
  title="Klasifikace prvků dokumentu na základě vizuálních rysů",
  booktitle="Znalosti 2008",
  year="2008",
  pages="347--350",
  publisher="Vydavateľstvo STU",
  address="Bratislava",
  isbn="978-80-227-2827-0",
  url="https://www.fit.vut.cz/research/publication/8564/"
}
Files
Projects
Security-Oriented Research in Information Technology, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, start: 2007-01-01, end: 2013-12-31, running
Research groups
Departments
Back to top