Detail práce
Web page segmentation utilizing clustering techniques
Získávání informací a jiné techniky dolování dat z webových stránek získávají na důležitosti s tím, jak se rozvíjí webové technologie a jak roste množství informací uložených na webu, jakožto jediném nosiči těchto informací. Spolu s tímto množství informací také ale roste množství obsahu, který není v kontextu prezentovaných informací ničím důležitý. To je jedním z důvodů, proč je důležité se intenzivně věnovat předzpracování informací uložených na webu. Segmentační algoritmy jsou jedním z možných způsobů předzpracování. Tato práce se věnuje využití shlukovacích technik pro zefektivnění existujících, ale i nalezení zcela nových algoritmů použitelných pro segmentaci webových stránek.
zpracování webových stránek, zpracování dokumentů, segmentace, shlukování, šablona, VIPS
@phdthesis{FITPT741, author = "Jan Zelen\'{y}", type = "Diserta\v{c}n\'{i} pr\'{a}ce", title = "Web page segmentation utilizing clustering techniques", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2017, location = "Brno, CZ", language = "english", url = "https://www.fit.vut.cz/study/phd-thesis/741/" }