Result Details
AnnoPage – systém pro automatickou anotaci objektů na stránce
Hradiš Michal, Ing., Ph.D., UAMT (FEEC), DCGM (FIT)
Dvořáková Martina
Žabička Petr
Jebavý Filip
Lapoš Benjamin
Lehečka Boris
Hrzinová Jana
Jiroušek Václav
Pavčík Filip
Kersch Filip
Herudková Markéta
Najmanová Anna
Lhoták Martin
AnnoPage je softwarový nástroj určený pro automatickou detekci a anotaci netextových prvků na stránkách digitalizovaných dokumentů. Systém identifikuje objekty, jako jsou fotografie, mapy, grafy či ilustrace, přiřazuje k nim odpovídající titulky a pomocí jazykových modelů generuje vícejazyčné popisy, klíčová slova a informace o barevnosti. Součástí řešení je také tvorba sémantických vektorových reprezentací (embeddingů) obrazových prvků, které umožňují jejich další analytické a vyhledávací využití. AnnoPage je dostupný jako nástroj příkazové řádky i jako distribuovaný systém založený na REST API, což umožňuje jeho integraci do knihovních a digitálně-humanitních workflow.
AnnoPage is a software tool designed for the automatic detection and annotation of non-textual elements in digitized document pages. The system identifies objects such as photographs, maps, graphs, and illustrations, assigns corresponding captions, and uses large language models to generate multilingual descriptions, keywords, and color information. It also produces semantic vector representations (embeddings) of visual elements, enabling advanced analysis and retrieval. AnnoPage is available both as a command-line tool and as a distributed REST API–based system, allowing seamless integration into library and digital humanities workflows.
tištěné dokumenty; zpracování digitalizovaných dokumentů; netextové elementy; obrázky; analýza obrazu
printed documents; digitized documents processing; non-textual elements; images; image analysis