Detail publikace

Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System

EGOROVA Ekaterina, VYDANA Hari K., BURGET Lukáš a ČERNOCKÝ Jan. Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System. In: Proceedings Interspeech 2021. Brno: International Speech Communication Association, 2021, s. 2901-2905. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/interspeech_2021/egorova21_interspeech.html
Název česky
Detekce slov mimo slovník pro end-to-end systém rozpoznávání řeči pomocí attention a CTC zarovnání
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

Tato práce zkoumá efektivitu detekce pozic slov mimo slovní zásobu (OOV) v dekódovaném promluvě pomocí vah pozornosti a výstupů CTC na snímek end-to-end systému predikujícího sekvence slov. Ukazujeme, že end-to-end přístup může být efektivní pro úlohu detekce OOV. Ukazuje se, že zarovnání CTC poskytují lepší časové informace o pozicích slov OOV než pozornost, a proto jsou pro daný úkol vhodnější. Zjištěné polohy výskytů OOV jsou využívány pro opakující se úlohu obnovy OOV, ve které jsou pravděpodobnostní reprezentace výslovností detekovaných OOV seskupeny za účelem nalezení opakujících se slov. Ukázalo se, že vylepšené výsledky detekce korelují s lepším výkonem obnovy opakujících se OOV.

Rok
2021
Strany
2901-2905
Časopis
Proceedings of Interspeech - on-line, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings Interspeech 2021
Konference
Interspeech Conference, Brno, CZ
Vydavatel
International Speech Communication Association
Místo
Brno, CZ
DOI
UT WoS
000841879502201
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12608,
   author = "Ekaterina Egorova and K. Hari Vydana and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}",
   title = "Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System",
   pages = "2901--2905",
   booktitle = "Proceedings Interspeech 2021",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2021,
   number = 8,
   year = 2021,
   location = "Brno, CZ",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2021-1756",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12608"
}
Nahoru