Detail publikace

BUT System for CHiME-6 Challenge

ŽMOLÍKOVÁ Kateřina, KOCOUR Martin, LANDINI Federico Nicolás, BENEŠ Karel, KARAFIÁT Martin, VYDANA Hari K., LOZANO Díez Alicia, PLCHOT Oldřich, BASKAR Murali K., ŠVEC Ján, MOŠNER Ladislav, MALENOVSKÝ Vladimír, BURGET Lukáš, YUSUF Bolaji, NOVOTNÝ Ondřej, GRÉZL František, SZŐKE Igor a ČERNOCKÝ Jan. BUT System for CHiME-6 Challenge. In: Proceedings of CHiME 2020 Virtual Workshop. Barcelona: University of Sheffield, 2020, s. 1-3. Dostupné z: https://chimechallenge.github.io/chime2020-workshop/programme.html
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Žmolíková Kateřina, Ing. (UPGM FIT VUT)
Kocour Martin, Ing. (UPGM FIT VUT)
Landini Federico Nicolás (UPGM FIT VUT)
Beneš Karel, Ing. (UPGM FIT VUT)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Vydana Hari K. (UPGM FIT VUT)
Lozano Díez Alicia, Ph.D. (UPGM FIT VUT)
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Baskar Murali K. (UPGM FIT VUT)
Švec Ján, Ing. (UPGM FIT VUT)
Mošner Ladislav, Ing. (UPGM FIT VUT)
Malenovský Vladimír, Ing., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Yusuf Bolaji (UPGM FIT VUT)
Novotný Ondřej, Ing. (UPGM FIT VUT)
Grézl František, Ing., Ph.D. (UPGM FIT VUT)
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, doc. Dr. Ing. (UPGM FIT VUT)
URL
Abstrakt

Tento dokument popisuje snahy VUT v Brně při vývoji systému pro výzvu CHiME-6 s nahrávkami na večerní párty [1]. Naše experimenty se týkají jak diarizace, tak rozpoznávání řeči součástí systému. Pro diarizaci používáme VBx framework, který používá Bayesovský skrytý Markovův model s vlastními převody na x-vektorech. Pro akustické modelování zkoumáme různé podskupiny dat pro trénink, různé architektury neuronových sítí, diskriminační trénink, robustnější i-vektory a semi-supervidovaný trénink na Vox-Celeb datech. Kromě toho provádíme experimenty s jazykovým modelem založeným na neuronové síti a zkoumáme, jak překonat malou velikost textového korpusu a začlenit kontext napříč segmenty. Při fúzování našich nejlepších systémů dosahujeme 41,21% / 42,55% WER na trati 1 pro vývoj, respektive 55,15% / 69,04% na trati 2 pro vývoj a hodnocení.

Rok
2020
Strany
1-3
Sborník
Proceedings of CHiME 2020 Virtual Workshop
Konference
The 6th International Workshop on Speech Processing in Everyday Environments, Barcelona - Virtual Workshop - satelite event to ICASSP 2020, ES
Vydavatel
University of Sheffield
Místo
Barcelona, ES
BibTeX
@INPROCEEDINGS{FITPUB12283,
   author = "Kate\v{r}ina \v{Z}mol\'{i}kov\'{a} and Martin Kocour and Nicol\'{a}s Federico Landini and Karel Bene\v{s} and Martin Karafi\'{a}t and K. Hari Vydana and Alicia D\'{i}ez Lozano and Old\v{r}ich Plchot and K. Murali Baskar and J\'{a}n \v{S}vec and Ladislav Mo\v{s}ner and Vladim\'{i}r Malenovsk\'{y} and Luk\'{a}\v{s} Burget and Bolaji Yusuf and Ond\v{r}ej Novotn\'{y} and Franti\v{s}ek Gr\'{e}zl and Igor Sz\H{o}ke and Jan \v{C}ernock\'{y}",
   title = "BUT System for CHiME-6 Challenge",
   pages = "1--3",
   booktitle = "Proceedings of CHiME 2020 Virtual Workshop",
   year = 2020,
   location = "Barcelona, ES",
   publisher = "University of Sheffield",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12283"
}
Nahoru