Detail výsledku

Klasifikace prvků dokumentu na základě vizuálních rysů

KUNC, M.; BURGET, R. Klasifikace prvků dokumentu na základě vizuálních rysů. Znalosti 2008. Bratislava: Vydavateľstvo STU, 2008. s. 347-350. ISBN: 978-80-227-2827-0.
Název anglicky
Document Element Classification Based on Visual Features
Typ
článek ve sborníku konference
Jazyk
česky
Autoři
Kunc Michael, Ing., FIT (FIT), UIFS (FIT)
Burget Radek, doc. Ing., Ph.D., UIFS (FIT)
Abstrakt

Příspěvek se zabývá vizuální segmentací webových stránek a následnou klasifikací detekovaných oblastí na základě jejich vizuálních vlastností. Segmentace, tedy detekce vizuálního členění stránky, je založena na bottom-up analýze stránky společně s analýzou vizuálně významných prvků a jejím výsledkem je model vizuálního členění zpracovávaného dokumentu. Samotná klasifikace potom využívá informace o vzájemné poloze oblastí a jejich vizuálních vlastnostech, které jsou v tomto modelu obsaženy.Příspěvek se dále zbývá experimentálním porovnáním dvou klasifikačních algoritmů pro daný účel na různých množinách dat.

Abstrakt anglicky

This paper deals with the visual segmentation of web documents and subsequent classification of the detected areas based on their visual attributes such as the mutual area positions, font properties and colors. We present an experimental evaluation of two classification algorithm for different data sets.

Klíčová slova

klasifikace dokumentů, vizuální informace, segmentace

Klíčová slova anglicky

document classification, visual information, segmentation

Rok
2008
Strany
347–350
Sborník
Znalosti 2008
Konference
Znalosti 2008
ISBN
978-80-227-2827-0
Vydavatel
Vydavateľstvo STU
Místo
Bratislava
BibTeX
@inproceedings{BUT27763,
  author="Michael {Kunc} and Radek {Burget}",
  title="Klasifikace prvků dokumentu na základě vizuálních rysů",
  booktitle="Znalosti 2008",
  year="2008",
  pages="347--350",
  publisher="Vydavateľstvo STU",
  address="Bratislava",
  isbn="978-80-227-2827-0",
  url="https://www.fit.vut.cz/research/publication/8564/"
}
Soubory
Projekty
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkumné skupiny
Pracoviště
Nahoru