Detail výsledku

FITLayout Web Page Segmentation Framework

Vznik: 2014
Typ
software
Jazyk
anglicky
Autoři
Burget Radek, doc. Ing., Ph.D., UIFS (FIT)
Milička Martin, Ing.
Popis

FitLayout is an extensible web page segmentation framework written in Java. It defines a generic Java API for representing a rendered web page and its division to visual areasand it provides a base for implementing page segmentation algorithms with a common application interface.As a sample segmentation method, it implements a previously published segmentation algorithm based onrecursive visual area merging and separator detection. The framework includes tools for post-processingthe segmentation result by different text or visual classification methods. Finally, it also provides tools for controlling the segmentation process and examining the segmentation results through a graphical user interface. The segmentation result may be stored as RDF data for later analysis.

Klíčová slova

web page segmentation, document analysis, text classification, web page rendering

URL
Licence
K využití výsledku jiným subjektem je vždy nutné nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Licenční podmínky

Volně šiřitelný software poskytovaný pod licencí GNU GPL.

Projekty
Centrum excelence IT4Innovations, MŠMT, Operační program Výzkum a vývoj pro inovace, ED1.1.00/02.0070, zahájení: 2011-01-01, ukončení: 2015-12-31, ukončen
Výzkum pokročilých metod ICT a jejich aplikace, VUT, Vnitřní projekty VUT, FIT-S-14-2299, zahájení: 2014-01-01, ukončení: 2016-12-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru