Detail publikace
SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT)
Beneš Karel, Ing. (UPGM FIT VUT)
Buchal Petr, Ing. (UPGM FIT VUT)
Kula Michal, Ing., Ph.D. (UPGM FIT VUT)
Tento článek se zabývá semi-supervised pro sekvenční úlohy, jako je optické rozpoznávání znaků nebo automatické rozpoznávání řeči. Navrhujeme novou loss funkci - SoftCTC - která je rozšířením CTC umožňujícím zohlednit více variant transkripce najednou. To umožňuje vynechat krok filtrování založený na jistotě, který je jinak klíčovou součástí přístupů založených na pseudo-labelingu v semi-supervised učení. Účinnost naší metody demonstrujeme na náročné úloze rozpoznávání rukopisu a docházíme k závěru, že SoftCTC se vyrovná úspěšnosti zpracování pomocí velmi specificky nastaveného filtrování. SoftCTC jsme také vyhodnotili z hlediska výpočetní efektivity a dospěli jsme k závěru, že je výrazně efektivnější než naivní přístup založený na CTC pro učení na více variantách transkripce, a zveřejnili jsme naši implementaci na GPU.
@ARTICLE{FITPUB12904, author = "Martin Ki\v{s}\v{s} and Michal Hradi\v{s} and Karel Bene\v{s} and Petr Buchal and Michal Kula", title = "SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels", pages = "177--193", booktitle = "International Journal on Document Analysis and Recognition", journal = "International Journal on Document Analysis and Recognition (IJDAR)", volume = 2024, number = 27, year = 2023, ISSN = "1433-2825", doi = "10.1007/s10032-023-00452-9", language = "english", url = "https://www.fit.vut.cz/research/publication/12904" }