Detail publikace

On-the-Fly Text Retrieval for end-to-end ASR Adaptation

YUSUF Bolaji, GOURAV Aditya, GANDHE Ankur a BULYKO Ivan. On-the-Fly Text Retrieval for end-to-end ASR Adaptation. In: Proceedings of ICASSP 2023. Rhodes Island: IEEE Signal Processing Society, 2023, s. 1-5. ISBN 978-1-7281-6327-7. Dostupné z: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10095857
Název česky
Dynamické dohledávání textu adaptaci celostního ASR
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Yusuf Bolaji (UPGM FIT VUT)
Gourav Aditya ()
Gandhe Ankur (AmazonCom)
Bulyko Ivan ()
URL
Abstrakt

End-to-end modely rozpoznávání řeči jsou vylepšeny začleněním externích textových zdrojů, obvykle fúzí s externím měřicí model. Takové jazykové modely je třeba kdykoli přeškolit zájmový korpus se mění. Kromě toho, protože ukládají celý korpus ve svých parametrech, vzácná slova mohou být náročná odvolání. V této práci navrhujeme rozšíření ASR na bázi převodníku model s jazykovým modelem vyhledávání, který přímo načítá z externí textový korpus věrohodná dokončení pro částečné ASR hy- potéza. Tato dokončení jsou pak integrována do následujících předběžných dikce adaptérem, který se trénuje jednou, takže korpus z úrok lze změnit, aniž by došlo k přetížení výpočtu vedoucí rekvalifikace. Naše experimenty ukazují, že navrhovaný model výrazně zlepšuje výkon základní linie převodníku na a dvojice datových sad na otázky. Dále překonává mělký výkon fúze na rozpoznání pojmenovaných entit asi 7 % relativních; když když se oba spojí, relativní zlepšení se zvýší na 13 %

Rok
2023
Strany
1-5
Sborník
Proceedings of ICASSP 2023
Konference
2023 IEEE International Conference on Acoustics, Speech and Signal Processing IEEE, Rhodes Island, Greece, GR
ISBN
978-1-7281-6327-7
Vydavatel
IEEE Signal Processing Society
Místo
Rhodes Island, GR
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB13050,
   author = "Bolaji Yusuf and Aditya Gourav and Ankur Gandhe and Ivan Bulyko",
   title = "On-the-Fly Text Retrieval for end-to-end ASR Adaptation",
   pages = "1--5",
   booktitle = "Proceedings of ICASSP 2023",
   year = 2023,
   location = "Rhodes Island, GR",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-7281-6327-7",
   doi = "10.1109/ICASSP49357.2023.10095857",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13050"
}
Nahoru