Detail publikace

Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition

KOHÚT Jan a HRADIŠ Michal. Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition. In: Document Analysis and Recognition - ICDAR 2023. Lecture Notes in Computer Science, roč. 14190. San José: Springer Nature Switzerland AG, 2023, s. 269-286. ISBN 978-3-031-41684-2. ISSN 0302-9743. Dostupné z: https://pero.fit.vutbr.cz/publications
Název česky
Efektivní dománová adaptace v rámci rozpoznávání ručně psaného písma
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Kohút Jan, Ing. (UPGM FIT VUT)
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT)
URL
Klíčová slova

Rozpoznávání ručně psaného písma, OCR, doladění.

Abstrakt

V mnoha úlohách strojového učení je k dispozici velký obecný dataset a malý specializovaný dataset. V takových situacích lze k adaptaci obecného modelu na cílový dataset použít různé metody doménové adaptace. Ukazujeme, že v případě neuronových sítí trénovaných pro rozpoznávání ručně psaného písma pomocí CTC funguje v takových scénářích překvapivě dobře jednoduché doladěn a že je odolné proti přeladění i pro velmi malé cílové doménové datasety. Hodnotili jsme chování doladění s ohledem na velikost trénovacích dat a kvalitu předtrénované sítě, a to jak pro pisatele trénovací sady, tak pro pisatele nové. Na velkém souboru reálných dat poskytlo jemné doladění průměrné relativní zlepšení zankové chyby o 25 % při 16 textových řádcích pro nové zapisovatele a o 50 % při 256 textových řádcích.

Rok
2023
Strany
269-286
Časopis
Lecture Notes in Computer Science, roč. 14190, č. 1, ISSN 0302-9743
Sborník
Document Analysis and Recognition - ICDAR 2023
Řada
Lecture Notes in Computer Science
Konference
International Conference on Document Analysis and Recognition, San José, California, USA, US
ISBN
978-3-031-41684-2
Vydavatel
Springer Nature Switzerland AG
Místo
San José, US
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12964,
   author = "Jan Koh\'{u}t and Michal Hradi\v{s}",
   title = "Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition",
   pages = "269--286",
   booktitle = "Document Analysis and Recognition - ICDAR 2023",
   series = "Lecture Notes in Computer Science",
   journal = "Lecture Notes in Computer Science",
   volume = 14190,
   number = 1,
   year = 2023,
   location = "San Jos\'{e}, US",
   publisher = "Springer Nature Switzerland AG",
   ISBN = "978-3-031-41684-2",
   ISSN = "0302-9743",
   doi = "10.1007/978-3-031-41685-9\_17",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12964"
}
Nahoru