Detail publikace

TS-Net: OCR Trained to Switch Between Text Transcription Styles

KOHÚT Jan a HRADIŠ Michal. TS-Net: OCR Trained to Switch Between Text Transcription Styles. In: Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021. Lecture Notes in Computer Science, roč. 12824. Lausanne: Springer Nature Switzerland AG, 2021, s. 478-493. ISBN 978-3-030-86336-4. ISSN 0302-9743. Dostupné z: https://pero.fit.vutbr.cz/publications
Název česky
TS-Net: OCR pro přepínání stylu přepisu
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Kohút Jan, Ing. (UPGM FIT VUT)
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT)
URL
Abstrakt

Více přepisovatelů vytváří přepisy v nejednotných stylech přepisu. 
To představuje problém pro trénování konzistentních systémů neuronových sítí pro rozpoznávání textu.
Navrhujeme Transcription Style Block (TSB), který se dokáže naučit přepínat mezi více styly přepisu bez explicitní znalosti pravidel přepisu.
TSB je adaptivní normalizace podmíněná identifikátory transkripčních stylů, např. čísly dokumentů nebo jmény přepisovatelů, a lze ji přidat do jakékoli standardní sítě pro rozpoznávání textu. 
Ukazujeme, že TSB je robustní vůči počtu a složitosti transkripčních stylů a nezhoršuje výkonnost rozpoznávání textu.
Díky časově a datově efektivní adaptaci na nový styl přepisu jsme dosáhli až 77\% relativního snížení chyby znaků na testovací sadě ve srovnání se sítí bez TSB.

Rok
2021
Strany
478-493
Časopis
Lecture Notes in Computer Science, roč. 12824, č. 1, ISSN 0302-9743
Sborník
Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021
Řada
Lecture Notes in Computer Science
Konference
International Conference on Document Analysis and Recognition, Lausanne, Switzerland, CH
ISBN
978-3-030-86336-4
Vydavatel
Springer Nature Switzerland AG
Místo
Lausanne, CH
DOI
UT WoS
000711880100032
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12463,
   author = "Jan Koh\'{u}t and Michal Hradi\v{s}",
   title = "TS-Net: OCR Trained to Switch Between Text Transcription Styles",
   pages = "478--493",
   booktitle = "Llad\'{o}s J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021",
   series = "Lecture Notes in Computer Science",
   journal = "Lecture Notes in Computer Science",
   volume = 12824,
   number = 1,
   year = 2021,
   location = "Lausanne, CH",
   publisher = "Springer Nature Switzerland AG",
   ISBN = "978-3-030-86336-4",
   ISSN = "0302-9743",
   doi = "10.1007/978-3-030-86337-1\_32",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12463"
}
Nahoru