Detail publikace

Towards Writing Style Adaptation in Handwriting Recognition

KOHÚT Jan, HRADIŠ Michal a KIŠŠ Martin. Towards Writing Style Adaptation in Handwriting Recognition. In: Document Analysis and Recognition - ICDAR 2023. Lecture Notes in Computer Science, roč. 14190. San José: Springer Nature Switzerland AG, 2023, s. 377-394. ISBN 978-3-031-41684-2. ISSN 0302-9743. Dostupné z: https://pero.fit.vutbr.cz/publications
Název česky
Adaptace na styl písma v rámci rozpoznávání ručně psaného textu
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Kohút Jan, Ing. (UPGM FIT VUT)
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT)
Kišš Martin, Ing. (UPGM FIT VUT)
URL
Klíčová slova

Rozpoznávání ručně psaného písma, OCR, doménová adaptace, doménově závislé parametry, doladění, CTC.

Abstrakt

Jednou z výzev rozpoznávání ručně psaného písma je přepis velkého množství značně odlišných stylů psaní. Současné přístupy explicitně nevyužívají informace o stylu pisatele, což může kvůli různým nejasnostem omezovat celkovou přesnost. Zkoumáme modely s parametry závislými na pisateli, které berou identitu pisatele jako další vstup. Navrhované modely lze trénovat na datasetech s oddíly, které pravděpodobně napsal jeden autor (např. jeden dopis, deník nebo kronika). Navrhujeme Writer Style Block (WSB), adaptivní nomralizační vrstvu podmíněnou naučenými embeddingy oddílů. Experimentovali jsme s různým umístěním a nastavením WSB a předtrénovanými embeddingy. Ukázali jsme, že náš přístup překonává základní přístup bez WSB pro pisatele trénovací sady a že je možné odhadnout embeddingy pro pisovatele nové. Adaptace na nové pisatele pomocí jednoduchého doladění však poskytuje vyšší přesnost při podobných výpočetních nárocích. Navržený přístup by měl být dále zkoumán z hlediska stability trénování a regularizace, aby bylo možné překonat jednoduché doladění.

Rok
2023
Strany
377-394
Časopis
Lecture Notes in Computer Science, roč. 14190, č. 1, ISSN 0302-9743
Sborník
Document Analysis and Recognition - ICDAR 2023
Řada
Lecture Notes in Computer Science
Konference
International Conference on Document Analysis and Recognition, San José, California, USA, US
ISBN
978-3-031-41684-2
Vydavatel
Springer Nature Switzerland AG
Místo
San José, US
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12963,
   author = "Jan Koh\'{u}t and Michal Hradi\v{s} and Martin Ki\v{s}\v{s}",
   title = "Towards Writing Style Adaptation in Handwriting Recognition",
   pages = "377--394",
   booktitle = "Document Analysis and Recognition - ICDAR 2023",
   series = "Lecture Notes in Computer Science",
   journal = "Lecture Notes in Computer Science",
   volume = 14190,
   number = 1,
   year = 2023,
   location = "San Jos\'{e}, US",
   publisher = "Springer Nature Switzerland AG",
   ISBN = "978-3-031-41684-2",
   ISSN = "0302-9743",
   doi = "10.1007/978-3-031-41685-9\_24",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12963"
}
Nahoru