Result Details

Metodika zpracování obrazových dokumentů

Created: 2024
English title
Methodology of image document processing
Type
approved methodologies
Language
Czech
Authors
Kišš Martin, Ing., DCGM (FIT)
Žabička Petr, Ing.
Dvořáková Martina
Hradiš Michal, Ing., Ph.D., UAMT (FEEC), DCGM (FIT)
Fremrová Květa
Bežová Michaela, Mgr. et Bc.
Jana Hrzinová, Mgr.
Jebavý Filip, Mgr.
Jiroušek Václav
Kersch Filip, Mgr.
Lehečka Dalibor
Lhoták Martin, Ing.
Pavčík Filip, Mgr., Ph.D.
Škvrňák Jan, Mgr., Ph.D.
Smolka Lucie
Bednařík Pavel
Description

Metodika si klade za cíl nabídnout knihovnám a dalším paměťovým institucím v České republice doporučené postupy pro usnadnění přístupu ke grafickým a dalším netextovým objektům obsaženým na stránkách digitalizovaných dokumentů, veřejnosti pak usnadnění orientace v těchto netextových prvcích a v možnostech jejich dalšího využití. Dílčími cíli vedoucími k snazší dohledatelnosti jsou zejména: 1) samotná automatická detekce netextových prvků v dokumentech obsažených v digitálních knihovnách, 2) jejich typová kategorizace a doplnění o potřebná kontextová a další popisná metadata s využitím metod strojového učení a 3) zápis získaných informací prostřednictvím mezinárodních metadatových standardů do metadat v souladu s národním Standardem NDK.

English description

The aim of the methodology is to offer libraries and other memory institutions in the Czech Republic recommended procedures for facilitating access to graphic and other non-textual objects contained on the pages of digitised documents, and for facilitating the public's orientation to these non-textual elements and the possibilities of their further use. The sub-objectives leading to easier traceability are in particular: 1) automatic detection of non-textual elements in documents contained in digital libraries, 2) their type categorization and supplementation with necessary contextual and other descriptive metadata using machine learning methods, and 3) writing the obtained information through international metadata standards into metadata in accordance with the national NDK Standard.

Keywords

digitální knihovny; strojové učení; rozpoznávání obrázků; vyhledávání obrázků; kreativní průmysl

English keywords

digital libraries;machine learning;image recognition;image retrieval;creative industries

URL
License
Use of the result by another entity is possible without acquiring a license (the result is not licensed)
License Fee
The licensor does not require a license fee for the result
Projects
Reanimated book - digitized library treasures for the creative industries, MK, NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030, DH23P03OVV033, start: 2023-03-01, end: 2027-12-31, running
Research groups
Departments
Back to top