Detail publikace
Creating Searchable Web Page Snapshots using Semantic Technologies
Salem Hamza, MSc (FIT VUT)
Pro mnoho aplikací je nutné vytvářet snímky webových stránek, které přesně popisují, jak se stránka v daném okamžiku zobrazovala v prohlížeči. Ukládání původního kódu (i když zahrnuje všechny odkazované zdroje) a vytváření bitmapových snímků obrazovky má mnoho nevýhod, pokud jde o vyhledávání, prohlížení a manipulaci s takovými snímky. V tomto článku ukazujeme odlišný přístup, který pro vykreslování webových stránek využívá dálkově ovládaný webový prohlížeč. Uchováváme kompletní informace o vykreslované stránce a všech částech jejího obsahu, transformujeme je do explicitní reprezentace založené na RDF modelu, který je uložen v úložišti. Uložené modely stránek pak lze zkoumat pomocí interaktivních webových nástrojů, exportovat v různých formátech, propojovat s dalšími zdroji dat a provádět dotazy pomocí jazyka SPARQL.
@INPROCEEDINGS{FITPUB12965, author = "Radek Burget and Hamza Salem", title = "Creating Searchable Web Page Snapshots using Semantic Technologies", pages = "355--358", booktitle = "Web Engineering - 23rd International Conference, ICWE 2023", series = "Lecture Notes in Computer Science", year = 2023, location = "Alicante, ES", publisher = "Springer Nature Switzerland AG", ISBN = "978-3-031-34443-5", doi = "10.1007/978-3-031-34444-2\_26", language = "english", url = "https://www.fit.vut.cz/research/publication/12965" }