Detail publikace

AT-ST: Self-Training Adaptation Strategy for OCR in Domains with Limited Transcriptions

KIŠŠ Martin, BENEŠ Karel a HRADIŠ Michal. AT-ST: Self-Training Adaptation Strategy for OCR in Domains with Limited Transcriptions. In: Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021. Lecture Notes in Computer Science, roč. 12824. Lausanne: Springer Nature Switzerland AG, 2021, s. 463-477. ISBN 978-3-030-86336-4. Dostupné z: https://pero.fit.vutbr.cz/publications
Název česky
AT-ST: Samoučící strategie adaptace pro OCR v doménách s omezeným počtem přepisů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Kišš Martin, Ing. (UPGM FIT VUT)
Beneš Karel, Ing. (UPGM FIT VUT)
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT)
URL
Klíčová slova

samoučení, rozpoznávání textu, jazykový model, neanotovaná data, určování jistoty, augmentace dat

Abstrakt

Tento článek se zabývá rozpoznáváním textu v doménách s omezeným počtem ručních anotací pomocí jednoduché strategie samoučení (self-training). Náš přístup by měl snížit nároky na lidskou anotaci, pokud je cílových dat v doméně dostatek, například při přepisu sbírky korespondence jedné osoby nebo rozsáhlého rukopisu. Navrhujeme trénovat prvotní (seed) systém na rozsáhlých datech z příbuzných domén smíchaných s dostupnými anotovanými daty z cílové domény. Tento systém přepisuje neanotovaná data z cílové domény, která se pak používají k trénování lepšího systému. Zkoumáme několik metrik jistoty a nakonec používáme pro výběr dat posteriorní pravděpodobnost přepisu. Kromě toho navrhujeme rozšířit data pomocí agresivního maskovacího schématu. Samoučením dosáhujeme snížení chybovosti znaků až o 55 % u ručně psaných dat a až o 38 % u tištěných dat. Samotné rozšíření o maskování snižuje chybovost přibližně o 10 % a jeho účinek je lépe patrný v případě obtížných ručně psaných dat.

Rok
2021
Strany
463-477
Sborník
Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021
Řada
Lecture Notes in Computer Science
Svazek
12824
Konference
International Conference on Document Analysis and Recognition, Lausanne, Switzerland, CH
ISBN
978-3-030-86336-4
Vydavatel
Springer Nature Switzerland AG
Místo
Lausanne, CH
DOI
UT WoS
000711880100031
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12464,
   author = "Martin Ki\v{s}\v{s} and Karel Bene\v{s} and Michal Hradi\v{s}",
   title = "AT-ST: Self-Training Adaptation Strategy for OCR in Domains with Limited Transcriptions",
   pages = "463--477",
   booktitle = "Llad\'{o}s J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021",
   series = "Lecture Notes in Computer Science",
   volume = 12824,
   year = 2021,
   location = "Lausanne, CH",
   publisher = "Springer Nature Switzerland AG",
   ISBN = "978-3-030-86336-4",
   doi = "10.1007/978-3-030-86337-1\_31",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12464"
}
Nahoru