Detail publikace
BUT OpenSAT 2017 speech recognition system
KARAFIÁT Martin, BASKAR Murali K., SZŐKE Igor, MALENOVSKÝ Vladimír, VESELÝ Karel, GRÉZL František, BURGET Lukáš a ČERNOCKÝ Jan. BUT OpenSAT 2017 speech recognition system. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 2638-2642. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/Interspeech_2018/abstracts/2457.html
Název česky
VUT systém rozpoznávání řeči pro OpenSAT 2017
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Baskar Murali K. (UPGM FIT VUT)
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT)
Malenovský Vladimír, Ing., Ph.D. (UPGM FIT VUT)
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT)
Grézl František, Ing., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Baskar Murali K. (UPGM FIT VUT)
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT)
Malenovský Vladimír, Ing., Ph.D. (UPGM FIT VUT)
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT)
Grézl František, Ing., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
URL
Abstrakt
Článek pojednává o VUT systému rozpoznávání řeči pro OpenSAT 2017 evaluace, které proběhly pro dvě domény: Low Resourced Languages and Public Safety Communications. První doména byla náročná kvůli nedostatku tréninkových dat, proto byly pro trénink BLSTM použity vícejazyčné přístupy a byly použity nedávno publikované sítě Residual Memory Networks vyžadující méně tréninkových dat. Kombinace obou přístupů vedla k vynikajícímu výkonu. Druhá doména byla náročná kvůli nahrávání v extrémních podmínkách: specifický kanál, reproduktor ve stresu, vysoká úroveň šumu. Proces získávání dat byl velmi důležitý pro dosažení přiměřeně dobrého výkonu.
Rok
2018
Strany
2638-2642
Časopis
Proceedings of Interspeech - on-line, roč. 2018, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2018
Konference
Interspeech Conference, Hyderabad, India, IN
Vydavatel
International Speech Communication Association
Místo
Hyderabad, IN
DOI
UT WoS
000465363900553
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11838, author = "Martin Karafi\'{a}t and K. Murali Baskar and Igor Sz\H{o}ke and Vladim\'{i}r Malenovsk\'{y} and Karel Vesel\'{y} and Franti\v{s}ek Gr\'{e}zl and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}", title = "BUT OpenSAT 2017 speech recognition system", pages = "2638--2642", booktitle = "Proceedings of Interspeech 2018", journal = "Proceedings of Interspeech - on-line", volume = 2018, number = 9, year = 2018, location = "Hyderabad, IN", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2018-2457", language = "english", url = "https://www.fit.vut.cz/research/publication/11838" }