Detail publikace
On-the-Fly Text Retrieval for end-to-end ASR Adaptation
End-to-end modely rozpoznávání řeči jsou vylepšeny začleněním externích textových zdrojů, obvykle fúzí s externím měřicí model. Takové jazykové modely je třeba kdykoli přeškolit zájmový korpus se mění. Kromě toho, protože ukládají celý korpus ve svých parametrech, vzácná slova mohou být náročná odvolání. V této práci navrhujeme rozšíření ASR na bázi převodníku model s jazykovým modelem vyhledávání, který přímo načítá z externí textový korpus věrohodná dokončení pro částečné ASR hy- potéza. Tato dokončení jsou pak integrována do následujících předběžných dikce adaptérem, který se trénuje jednou, takže korpus z úrok lze změnit, aniž by došlo k přetížení výpočtu vedoucí rekvalifikace. Naše experimenty ukazují, že navrhovaný model výrazně zlepšuje výkon základní linie převodníku na a dvojice datových sad na otázky. Dále překonává mělký výkon fúze na rozpoznání pojmenovaných entit asi 7 % relativních; když když se oba spojí, relativní zlepšení se zvýší na 13 %
@INPROCEEDINGS{FITPUB13050, author = "Bolaji Yusuf and Aditya Gourav and Ankur Gandhe and Ivan Bulyko", title = "On-the-Fly Text Retrieval for end-to-end ASR Adaptation", pages = "1--5", booktitle = "Proceedings of ICASSP 2023", year = 2023, location = "Rhodes Island, GR", publisher = "IEEE Signal Processing Society", ISBN = "978-1-7281-6327-7", doi = "10.1109/ICASSP49357.2023.10095857", language = "english", url = "https://www.fit.vut.cz/research/publication/13050" }