Detail publikace
BUT System for CHiME-6 Challenge
Kocour Martin, Ing. (UPGM FIT VUT)
Landini Federico Nicolás (UPGM FIT VUT)
Beneš Karel, Ing. (UPGM FIT VUT)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Vydana Hari K. (UPGM FIT VUT)
Lozano Díez Alicia, Ph.D. (UPGM FIT VUT)
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Baskar Murali K. (UPGM FIT VUT)
Švec Ján, Ing. (UPGM FIT VUT)
Mošner Ladislav, Ing. (UPGM FIT VUT)
Malenovský Vladimír, Ing., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Yusuf Bolaji (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Grézl František, Ing., Ph.D. (UPGM FIT VUT)
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Tento dokument popisuje snahy VUT v Brně při vývoji systému pro výzvu CHiME-6 s nahrávkami na večerní párty [1]. Naše experimenty se týkají jak diarizace, tak rozpoznávání řeči součástí systému. Pro diarizaci používáme VBx framework, který používá Bayesovský skrytý Markovův model s vlastními převody na x-vektorech. Pro akustické modelování zkoumáme různé podskupiny dat pro trénink, různé architektury neuronových sítí, diskriminační trénink, robustnější i-vektory a semi-supervidovaný trénink na Vox-Celeb datech. Kromě toho provádíme experimenty s jazykovým modelem založeným na neuronové síti a zkoumáme, jak překonat malou velikost textového korpusu a začlenit kontext napříč segmenty. Při fúzování našich nejlepších systémů dosahujeme 41,21% / 42,55% WER na trati 1 pro vývoj, respektive 55,15% / 69,04% na trati 2 pro vývoj a hodnocení.
@INPROCEEDINGS{FITPUB12283, author = "Kate\v{r}ina \v{Z}mol\'{i}kov\'{a} and Martin Kocour and Nicol\'{a}s Federico Landini and Karel Bene\v{s} and Martin Karafi\'{a}t and K. Hari Vydana and Alicia D\'{i}ez Lozano and Old\v{r}ich Plchot and K. Murali Baskar and J\'{a}n \v{S}vec and Ladislav Mo\v{s}ner and Vladim\'{i}r Malenovsk\'{y} and Luk\'{a}\v{s} Burget and Bolaji Yusuf and Ond\v{r}ej Novotn\'{y} and Franti\v{s}ek Gr\'{e}zl and Igor Sz\H{o}ke and Jan \v{C}ernock\'{y}", title = "BUT System for CHiME-6 Challenge", pages = "1--3", booktitle = "Proceedings of CHiME 2020 Virtual Workshop", year = 2020, location = "Barcelona, ES", publisher = "University of Sheffield", doi = "10.21437/CHiME.2020-13", language = "english", url = "https://www.fit.vut.cz/research/publication/12283" }