Detail publikace

Implementing contextual biasing in GPU decoder for online ASR

NIGMATULINA Iuliia, MADIKERI Srikanth, VILLATORO-TELLO Esaú, MOTLÍČEK Petr, ZULUAGA-GOMEZ Juan, PANDIA Karthick a GANAPATHIRAJU Aravind. Implementing contextual biasing in GPU decoder for online ASR. In: Proceedings of the Annual Conference of International Speech Communication Association, INTERSPEECH. Dublin: International Speech Communication Association, 2023, s. 4494-4498. ISSN 1990-9772. Dostupné z: https://www.isca-archive.org/interspeech_2023/nigmatulina23_interspeech.html
Název česky
Implementace kontextové předpojatosti (biasu) v GPU dekodéru pro online ASR
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Nigmatulina Iuliia (IDIAP)
Madikeri Srikanth (IDIAP)
Villatoro-tello Esaú (IDIAP)
Motlíček Petr, doc. Ing., Ph.D. (UPGM FIT VUT)
Zuluaga-Gomez Juan (IDIAP)
Pandia Karthick ()
Ganapathiraju Aravind ()
URL
Abstrakt

Dekódování GPU výrazně zrychluje výstup předpovědí ASR. Zatímco GPU se již používají pro online ASR dekódování, následné zpracování a rescoring na GPU ne zatím řádně prošetřena. Vyhodnocování s dostupným kontextem informace mohou výrazně zlepšit předpovědi ASR. Předchozí studie prokázaly životaschopnost mřížového vyhodnocování v dekódování a vážení jazykového modelu (LM) v režimu offline a online scénáře CPU. Při dekódování GPU v reálném čase, hypotézy částečného rozpoznávání jsou vytvářeny bez generování mřížky, což dělá implementaci ovlivnění složitější. Článek navrhuje a popisuje přístup k integraci kontextové ovlivnění při dekódování GPU v reálném čase při využívání standardní Kaldi GPU dekodér. Kromě zkreslení částečného Předpovědi ASR, náš přístup také umožňuje dynamický kontext přepínání umožňující flexibilní vyhodnocování každého segmentu řeči přímo na GPU. Kód je veřejně uvolněn1 a testován pomocí open-source testovací sady.

Rok
2023
Strany
4494-4498
Časopis
Proceedings of Interspeech - on-line, roč. 2023, č. 8, ISSN 1990-9772
Sborník
Proceedings of the Annual Conference of International Speech Communication Association, INTERSPEECH
Konference
Interspeech Conference, Dublin, IE
Vydavatel
International Speech Communication Association
Místo
Dublin, IE
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB13155,
   author = "Iuliia Nigmatulina and Srikanth Madikeri and Esa\'{u} Villatoro-tello and Petr Motl\'{i}\v{c}ek and Juan Zuluaga-Gomez and Karthick Pandia and Aravind Ganapathiraju",
   title = "Implementing contextual biasing in GPU decoder for online ASR",
   pages = "4494--4498",
   booktitle = "Proceedings of the Annual Conference of International Speech Communication Association, INTERSPEECH",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2023,
   number = 8,
   year = 2023,
   location = "Dublin, IE",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2023-2449",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13155"
}
Nahoru