Detail publikace
On-the-Fly Text Retrieval for end-to-end ASR Adaptation
retrieval, language model, domain adaptation, end-to-end ASR, RNN transducer, contextual biasing
End-to-end modely rozpoznávání řeči jsou vylepšeny začleněním
externích textových zdrojů, obvykle fúzí s externím
měřicí model. Takové jazykové modely je třeba kdykoli přeškolit
zájmový korpus se mění. Kromě toho, protože ukládají
celý korpus ve svých parametrech, vzácná slova mohou být náročná
odvolání. V této práci navrhujeme rozšíření ASR na bázi převodníku
model s jazykovým modelem vyhledávání, který přímo načítá z
externí textový korpus věrohodná dokončení pro částečné ASR hy-
potéza. Tato dokončení jsou pak integrována do následujících předběžných
dikce adaptérem, který se trénuje jednou, takže korpus z
úrok lze změnit, aniž by došlo k přetížení výpočtu
vedoucí rekvalifikace. Naše experimenty ukazují, že navrhovaný model
výrazně zlepšuje výkon základní linie převodníku na a
dvojice datových sad na otázky. Dále překonává mělký výkon
fúze na rozpoznání pojmenovaných entit asi 7 % relativních; když
když se oba spojí, relativní zlepšení se zvýší na 13 %
@inproceedings{BUT185196,
author="YUSUF, B. and GOURAV, A. and GANDHE, A. and BULYKO, I.",
title="On-the-Fly Text Retrieval for end-to-end ASR Adaptation",
booktitle="Proceedings of ICASSP 2023",
year="2023",
pages="1--5",
publisher="IEEE Signal Processing Society",
address="Rhodes Island",
doi="10.1109/ICASSP49357.2023.10095857",
isbn="978-1-7281-6327-7",
url="https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10095857"
}