Detail publikace

Text-Based Web Page Classification with Use of Visual Information

BARTÍK Vladimír. Text-Based Web Page Classification with Use of Visual Information. In: 2010 International Conference on Advances in Social Network Analysis and Mining. Odense: IEEE Computer Society, 2010, s. 416-420. ISBN 978-0-7695-4138-9.
Název česky
Klasifikace webových stránek založená na textu s využitím vizuální informace
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Abstrakt

S neustále rosoucím počtem stránek na webu je potřeba tyto stránky klasifikovat do kategorií, aby bylo možné jejich indexování a vyhledávání. Je zde popsána metoda, která využívá textovou i vizuální informaci pro reprezentaci obsahu webové stránky. Je zde popsáno několik vah pro termy, které jsou modifikacemi TF a TF-IDF. Modifikae jsou založeny na vizuálních oblastech stránky, v nichž se text nachází a jejich vizuálních vlastnostech. Na konci článku je obsaženo několik výsledků experimentů.

Rok
2010
Strany
416-420
Sborník
2010 International Conference on Advances in Social Network Analysis and Mining
Konference
International Symposium on Open Source Intelligence & Web Mining 2010, Odense, DK
ISBN
978-0-7695-4138-9
Vydavatel
IEEE Computer Society
Místo
Odense, DK
BibTeX
@INPROCEEDINGS{FITPUB9274,
   author = "Vladim\'{i}r Bart\'{i}k",
   title = "Text-Based Web Page Classification with Use of Visual Information",
   pages = "416--420",
   booktitle = "2010 International Conference on Advances in Social Network Analysis and Mining",
   year = 2010,
   location = "Odense, DK",
   publisher = "IEEE Computer Society",
   ISBN = "978-0-7695-4138-9",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/9274"
}
Nahoru