Detail výsledku
Isomorphic mapping of DOM trees for Cluster-Based Page Segmentation
ZELENÝ, J.; BURGET, R. Isomorphic mapping of DOM trees for Cluster-Based Page Segmentation. Proceedings of the Twelfth International Conference on Informatics INFORMATICS'2013. Spišská Nová Ves: The University of Technology Košice, 2013. p. 256-261. ISBN: 978-80-8143-127-2.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Zelený Jan, Ing., Ph.D., UIFS (FIT)
Burget Radek, doc. Ing., Ph.D., UIFS (FIT)
Burget Radek, doc. Ing., Ph.D., UIFS (FIT)
Abstrakt
In our previous work we have designed a method for fast and precise Web page segmentation. In this paper we propose a complementary algorithm and data structures that extend the original design. The extension is focused on isomorphic mapping between two DOM trees. Our main objective is to improve robustness of our original solution. We successfully design and implement a solution that is more robust while keeping the efficiency of the original simple one. To prove qualities of our new design we also offer an experimental evaluation of the new implementation.
Klíčová slova
vision-based page segmentation, cache, template detection, cluster-based page segmentation, DOM, tree mapping
Rok
2013
Strany
256–261
Sborník
Proceedings of the Twelfth International Conference on Informatics INFORMATICS'2013
Konference
Informatics 2013 - 12th International Scientific Conference on Informatics
ISBN
978-80-8143-127-2
Vydavatel
The University of Technology Košice
Místo
Spišská Nová Ves
BibTeX
@inproceedings{BUT103543,
author="Jan {Zelený} and Radek {Burget}",
title="Isomorphic mapping of DOM trees for Cluster-Based Page Segmentation",
booktitle="Proceedings of the Twelfth International Conference on Informatics INFORMATICS'2013",
year="2013",
pages="256--261",
publisher="The University of Technology Košice",
address="Spišská Nová Ves",
isbn="978-80-8143-127-2",
url="https://www.fit.vut.cz/research/publication/10414/"
}
Soubory
Projekty
Centrum excelence IT4Innovations, MŠMT, Operační program Výzkum a vývoj pro inovace, ED1.1.00/02.0070, zahájení: 2011-01-01, ukončení: 2015-12-31, ukončen
Pokročilé rozpoznávání a prezentace multimediálních dat, VUT, Vnitřní projekty VUT, FIT-S-11-2, zahájení: 2011-01-01, ukončení: 2013-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Pokročilé rozpoznávání a prezentace multimediálních dat, VUT, Vnitřní projekty VUT, FIT-S-11-2, zahájení: 2011-01-01, ukončení: 2013-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkumné skupiny
Pracoviště
Ústav informačních systémů
(UIFS)