Detail publikace
SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels
Hradiš Michal, Ing., Ph.D. (UPGM)
Beneš Karel, Ing., Ph.D. (UPGM)
Buchal Petr, Ing.
Kula Michal, Ing., Ph.D. (UPGM)
CTC, SoftCTC, OCR, Text recognition, Confusion networks
Tento článek se zabývá semi-supervised pro sekvenční úlohy, jako je optické rozpoznávání znaků nebo automatické rozpoznávání řeči. Navrhujeme novou loss funkci - SoftCTC - která je rozšířením CTC umožňujícím zohlednit více variant transkripce najednou. To umožňuje vynechat krok filtrování založený na jistotě, který je jinak klíčovou součástí přístupů založených na pseudo-labelingu v semi-supervised učení. Účinnost naší metody demonstrujeme na náročné úloze rozpoznávání rukopisu a docházíme k závěru, že SoftCTC se vyrovná úspěšnosti zpracování pomocí velmi specificky nastaveného filtrování. SoftCTC jsme také vyhodnotili z hlediska výpočetní efektivity a dospěli jsme k závěru, že je výrazně efektivnější než naivní přístup založený na CTC pro učení na více variantách transkripce, a zveřejnili jsme naši implementaci na GPU.
@article{BUT185136,
author="Martin {Kišš} and Michal {Hradiš} and Karel {Beneš} and Petr {Buchal} and Michal {Kula}",
title="SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels",
journal="International Journal on Document Analysis and Recognition",
year="2023",
volume="2024",
number="27",
pages="177--193",
doi="10.1007/s10032-023-00452-9",
issn="1433-2825",
url="https://link.springer.com/article/10.1007/s10032-023-00452-9"
}