Detail publikace

Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition

ŠŮSTEK Martin, SADHU Samik a HEŘMANSKÝ Hynek. Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition. In: Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Incheon: International Speech Communication Association, 2022, s. 1046-1050. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/pdfs/interspeech_2022/sustek22_interspeech.pdf
Název česky
Vypořádání se s neznámými testovacími prostředími v kontextu kontinuálního učení a end-to-end automatického rozpoznávače řeči
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Šůstek Martin, Ing. (UPGM FIT VUT)
Sadhu Samik ()
Heřmanský Hynek, prof. Ing., Dr.Eng. (UPGM FIT VUT)
URL
Klíčová slova

rozpoznávání řeči, kontinuální učení, rozpoznávání řeči z několika zdrojů, kombinace modelů

Abstrakt

Nepřetržité učení se z dat je běžný a nepříliš namáhavý úkol pro lidi, avšak pro strojové učení stále představuje významnou výzvu. Když je natrénovaný model testován v předem neznámých podmínkách, často nezobecňuje dobře. Tento článek navrhuje matematicky motivovaný dynamicky se rozšiřující model s nezávislými částmi, z nichž každá využívala různý soubor dat během trénování. Výsledný model nevykazuje katastrofické zapomínání znalostí získaných z dříve viděných dat a zároveň dokáže integrovat znalosti z nových dat. Během inference dochází k vážené kombinaci modelů na základě odhadnutého pravděpodobnostního rozložení aktivací uvnitř každého modelu realizovaného pomocí neuronové sítě.

Rok
2022
Strany
1046-1050
Časopis
Proceedings of Interspeech - on-line, roč. 2022, č. 9, ISSN 1990-9772
Sborník
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Konference
Interspeech Conference, Incheon, KR
Vydavatel
International Speech Communication Association
Místo
Incheon, KR
DOI
UT WoS
000900724501045
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12945,
   author = "Martin \v{S}\r{u}stek and Samik Sadhu and Hynek He\v{r}mansk\'{y}",
   title = "Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition",
   pages = "1046--1050",
   booktitle = "Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2022,
   number = 9,
   year = 2022,
   location = "Incheon, KR",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2022-11139",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12945"
}
Nahoru