Detail publikace
Visual Area Classification for Article Identification in Web Documents
BURGET Radek. Visual Area Classification for Article Identification in Web Documents. In: 21st International Workshop on Databases and Expert Systems Applications. Bilbao: IEEE Computer Society, 2010, s. 171-175. ISBN 978-0-7695-4174-7.
Název česky
Vizuální klasifikace pro identifikaci článků ve webových dokumentech
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT)
Abstrakt
Články zveřejněné na WWW jsou obvykle publikovány v rámci složitějších HTML dokumentů, které obsahují mnoho typů informací, které nejsou explicitně označeny. V tomto příspěvku navrhujeme přístup k analýze vizuální informace za účelem nalezení článků ve složitých HTML dokumentech. Používáme přístup založený na klasifikace pro identifikaci důležitých částí článku na stránce a navrhujeme algoritmus pro detekci hranic článku na stránce. Dále uvádíme výsledky experimentálního vyhodnocení navrženého postupu.
Rok
2010
Strany
171-175
Sborník
21st International Workshop on Databases and Expert Systems Applications
Konference
9th International Workshop on Web Semantics, Bilbao, ES
ISBN
978-0-7695-4174-7
Vydavatel
IEEE Computer Society
Místo
Bilbao, ES
BibTeX
@INPROCEEDINGS{FITPUB9292, author = "Radek Burget", title = "Visual Area Classification for Article Identification in Web Documents", pages = "171--175", booktitle = "21st International Workshop on Databases and Expert Systems Applications", year = 2010, location = "Bilbao, ES", publisher = "IEEE Computer Society", ISBN = "978-0-7695-4174-7", language = "english", url = "https://www.fit.vut.cz/research/publication/9292" }