Detail výsledku

Využití PERO OCR při přepisu rukopisů

DVOŘÁKOVÁ, M.; HRADIŠ, M.; ŽABIČKA, P.; KOHÚT, J.; KIŠŠ, M.; BENEŠ, K. Využití PERO OCR při přepisu rukopisů. Archivní časopis, 2022, roč. 72, č. 1, s. 14-27. ISSN: 0004-0398.
Název anglicky
The use of PERO OCR in Manuscript Transcription
Typ
článek v časopise
Jazyk
česky
Autoři
Dvořáková Martina
Hradiš Michal, Ing., Ph.D., UAMT (FEKT), UPGM (FIT)
Žabička Petr, Ing.
Kohút Jan, Ing., UPGM (FIT)
Kišš Martin, Ing., UPGM (FIT)
Beneš Karel, Ing., Ph.D., UPGM (FIT)
Abstrakt


Základním předpokladem pro automatické zpracování ručně psaných dokumentů je kvalitní přepis jejich obsahu. Tento článek představuje nástroje pro automatický přepis dokumentů vyvíjené v projektu PERO spolu s webovou aplikací pro efektivní manuální korekce. Případová studie využití těchto nástrojů ukázala výraznou úsporu času při vytváření přepisů starších rukopisů bez negativního vlivu na kvalitu těchto přepisů. Zároveň analýza největších dokumentů zpracovaných a opravených uživateli webové aplikace PERO-OCR v posledních dvou letech ukazuje, že chybovost u dobře čitelných českých rukopisů se pohybuje od 1 % do 4 %, což může být pro mnoho účelů dostatečné. 

Abstrakt anglicky


The basic prerequisite for the automatic processing of handwritten documents is a high-quality transcription of their content. This paper presents the automatic document transcription tools developed in the PERO project, together with a web application for efficient manual corrections. A case study dealing with the use of these tools has shown significant time savings in creating transcriptions of older manuscripts without negatively affecting the quality of these transcriptions. At the same time, an analysis of the largest documents processed and corrected by the users of the PERO-OCR web application over the last two years shows that the error rate for well-legible Czech manuscripts ranges from 1 % to 4 %, which may be sufficient for numerous purposes. 

Klíčová slova

Rukopisy, Kurrent, rozpoznávání ručně psaného písma, PERO OCR, případová studie

Klíčová slova anglicky

Manuscripts, Kurrent, handwritten text recognition, PERO OCR, case study

Rok
2022
Strany
14–27
Časopis
Archivní časopis, roč. 72, č. 1, ISSN 0004-0398
Kniha
Archivní časopis
Místo
Praha
BibTeX
@article{BUT181521,
  author="Martina {Dvořáková} and Michal {Hradiš} and Petr {Žabička} and Jan {Kohút} and Martin {Kišš} and Karel {Beneš}",
  title="Využití PERO OCR při přepisu rukopisů",
  journal="Archivní časopis",
  year="2022",
  volume="72",
  number="1",
  pages="14--27",
  issn="0004-0398",
  url="https://www.fit.vut.cz/research/publication/12914/"
}
Soubory
Projekty
Moderní metody zpracování, analýzy a zobrazování multimediálních a 3D dat, VUT, Vnitřní projekty VUT, FIT-S-20-6460, zahájení: 2020-03-01, ukončení: 2023-02-28, ukončen
Pokročilá extrakce a rozpoznávání obsahu tištěných a rukou psaných digitalizátů pro zvýšení jejich přístupnosti a využitelnosti, MK, Program na podporu aplikovaného výzkumu a experimentálního vývoje národní a kulturní identity na léta 2016 až 2022 (NAKI II), DG18P02OVV055, zahájení: 2018-03-01, ukončení: 2022-12-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru