Detail výsledku
Text-Based Web Page Classification with Use of Visual Information
BARTÍK, V. Text-Based Web Page Classification with Use of Visual Information. 2010 International Conference on Advances in Social Network Analysis and Mining. Odense: IEEE Computer Society, 2010. p. 416-420. ISBN: 978-0-7695-4138-9.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Bartík Vladimír, Ing., Ph.D., UIFS (FIT)
Abstrakt
As the number of pages on the web is permanently increasing, there is a need to classify pages into categories to facilitate indexing or searching them. In the method proposed here, we use both textual and visual information to find a suitable representation of web page content. In this paper, several term weights, based on TF or TF-IDF weighting are proposed. Modification is based on visual areas, in which the text appears and their visual properties. Some results of experiments are included in the final part of the paper.
Klíčová slova
web page classification, term weights, text classification, TF-IDF weight, visual information, visual blocks
Rok
2010
Strany
416–420
Sborník
2010 International Conference on Advances in Social Network Analysis and Mining
Konference
International Symposium on Open Source Intelligence & Web Mining 2010
ISBN
978-0-7695-4138-9
Vydavatel
IEEE Computer Society
Místo
Odense
BibTeX
@inproceedings{BUT35625,
author="Vladimír {Bartík}",
title="Text-Based Web Page Classification with Use of Visual Information",
booktitle="2010 International Conference on Advances in Social Network Analysis and Mining",
year="2010",
pages="416--420",
publisher="IEEE Computer Society",
address="Odense",
isbn="978-0-7695-4138-9"
}
Projekty
Rozpoznávání a prezentace informací z multimediálních dat, VUT, Vnitřní projekty VUT, FIT-S-10-2, 2010, zahájení: 2010-04-01, ukončení: 2010-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkumné skupiny
Pracoviště
Ústav informačních systémů
(UIFS)