Detail publikace

Visual Area Classification for Article Identification in Web Documents

BURGET Radek. Visual Area Classification for Article Identification in Web Documents. In: 21st International Workshop on Databases and Expert Systems Applications. Bilbao: IEEE Computer Society, 2010, s. 171-175. ISBN 978-0-7695-4174-7.
Název česky
Vizuální klasifikace pro identifikaci článků ve webových dokumentech
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Abstrakt

Články zveřejněné na WWW jsou obvykle publikovány v rámci složitějších HTML dokumentů, které obsahují mnoho typů informací, které nejsou explicitně označeny. V tomto příspěvku navrhujeme přístup k analýze vizuální informace za účelem nalezení článků ve složitých HTML dokumentech. Používáme přístup založený na klasifikace pro identifikaci důležitých částí článku na stránce a navrhujeme algoritmus pro detekci hranic článku na stránce. Dále uvádíme výsledky experimentálního vyhodnocení navrženého postupu.

Rok
2010
Strany
171-175
Sborník
21st International Workshop on Databases and Expert Systems Applications
Konference
9th International Workshop on Web Semantics, Bilbao, ES
ISBN
978-0-7695-4174-7
Vydavatel
IEEE Computer Society
Místo
Bilbao, ES
BibTeX
@INPROCEEDINGS{FITPUB9292,
   author = "Radek Burget",
   title = "Visual Area Classification for Article Identification in Web Documents",
   pages = "171--175",
   booktitle = "21st International Workshop on Databases and Expert Systems Applications",
   year = 2010,
   location = "Bilbao, ES",
   publisher = "IEEE Computer Society",
   ISBN = "978-0-7695-4174-7",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/9292"
}
Nahoru