Detail publikace
Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition
Rozpoznávání ručně psaného písma, OCR, doladění.
V mnoha úlohách strojového učení je k dispozici velký obecný dataset a malý specializovaný dataset. V takových situacích lze k adaptaci obecného modelu na cílový dataset použít různé metody doménové adaptace. Ukazujeme, že v případě neuronových sítí trénovaných pro rozpoznávání ručně psaného písma pomocí CTC funguje v takových scénářích překvapivě dobře jednoduché doladěn a že je odolné proti přeladění i pro velmi malé cílové doménové datasety. Hodnotili jsme chování doladění s ohledem na velikost trénovacích dat a kvalitu předtrénované sítě, a to jak pro pisatele trénovací sady, tak pro pisatele nové. Na velkém souboru reálných dat poskytlo jemné doladění průměrné relativní zlepšení zankové chyby o 25 % při 16 textových řádcích pro nové zapisovatele a o 50 % při 256 textových řádcích.
@INPROCEEDINGS{FITPUB12964, author = "Jan Koh\'{u}t and Michal Hradi\v{s}", title = "Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition", pages = "269--286", booktitle = "Document Analysis and Recognition - ICDAR 2023", series = "Lecture Notes in Computer Science", journal = "Lecture Notes in Computer Science", volume = 14190, number = 1, year = 2023, location = "San Jos\'{e}, US", publisher = "Springer Nature Switzerland AG", ISBN = "978-3-031-41684-2", ISSN = "0302-9743", doi = "10.1007/978-3-031-41685-9\_17", language = "english", url = "https://www.fit.vut.cz/research/publication/12964" }