Detail výsledku

AnnoPage – systém pro automatickou anotaci objektů na stránce

Vznik: 2025
Název anglicky
AnnoPage – a system for automatic annotation of visual document content
Typ
software
Jazyk
čeština
Autoři
Kišš Martin, Ing., UPGM (FIT)
Hradiš Michal, Ing., Ph.D., UAMT (FEKT), UPGM (FIT)
Dvořáková Martina
Žabička Petr
Jebavý Filip
Lapoš Benjamin
Lehečka Boris
Hrzinová Jana
Jiroušek Václav
Pavčík Filip
Kersch Filip
Herudková Markéta
Najmanová Anna
Lhoták Martin
Popis

AnnoPage je softwarový nástroj určený pro automatickou detekci a anotaci netextových prvků na stránkách digitalizovaných dokumentů. Systém identifikuje objekty, jako jsou fotografie, mapy, grafy či ilustrace, přiřazuje k nim odpovídající titulky a pomocí jazykových modelů generuje vícejazyčné popisy, klíčová slova a informace o barevnosti. Součástí řešení je také tvorba sémantických vektorových reprezentací (embeddingů) obrazových prvků, které umožňují jejich další analytické a vyhledávací využití. AnnoPage je dostupný jako nástroj příkazové řádky i jako distribuovaný systém založený na REST API, což umožňuje jeho integraci do knihovních a digitálně-humanitních workflow.

Popis anglicky

AnnoPage is a software tool designed for the automatic detection and annotation of non-textual elements in digitized document pages. The system identifies objects such as photographs, maps, graphs, and illustrations, assigns corresponding captions, and uses large language models to generate multilingual descriptions, keywords, and color information. It also produces semantic vector representations (embeddings) of visual elements, enabling advanced analysis and retrieval. AnnoPage is available both as a command-line tool and as a distributed REST API–based system, allowing seamless integration into library and digital humanities workflows.

Klíčová slova

tištěné dokumenty; zpracování digitalizovaných dokumentů; netextové elementy; obrázky; analýza obrazu

Klíčová slova anglicky

printed documents; digitized documents processing; non-textual elements; images; image analysis

URL
Licence
Využití výsledku jiným subjektem je možné bez nabytí licence (výsledek není licencován)
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Projekty
Orbis pictus - oživení knihy pro kulturní a kreativní odvětví, MK, NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030, DH23P03OVV033, zahájení: 2023-03-01, ukončení: 2027-12-31, řešení
Pracoviště
Nahoru