Detail výsledku

Lemmiwinks framework, MozArch aplikace

Vznik: 2018
Typ
software
Jazyk
anglicky
Autoři
Serečun Viliam, Ing., FIT (FIT)
Veselý Vladimír, Ing., Ph.D., UIFS (FIT)
Popis

Many legal institutions require the burden of proof on web content. These tools deal with the problem of automating web refurbishment and web archiving. The main goal is to provide solutions with open source code that will satisfy legal institutions with their requirements. This work represents two main products. The first is the Lemmiwinks framework, which is the cornerstone for developing applications for website extraction and archiving. The second product is MozArch, a prototype showing the use of the framework. The MozArchi output is a MAFF file that includes a refurbished web page, website screenshot, and a meta-information table such as IP addresses, ports, and a time stamp.

Klíčová slova
Web archiving, Mozilla Archive Format, Web scraping, Web indexing, Lemmiwinks, MultiFunctional Index Scraping Tool
Umístění

Zdrojové kódy k Lemmiwinks frameworku: https://github.com/nesfit/Lemmiwinks Zdrojové kódy k MozArchive aplikaci: https://github.com/nesfit/mozarch

Licence
K využití výsledku jiným subjektem je vždy nutné nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Licenční podmínky

Softwary jsou nabízené pod MIT licencí

Výzkumné skupiny
Pracoviště
Nahoru