Detail publikace
But System for the Second Dihard Speech Diarization Challenge
LANDINI Federico Nicolás, WANG Shuai, DIEZ Sánchez Mireia, BURGET Lukáš, MATĚJKA Pavel, ŽMOLÍKOVÁ Kateřina, MOŠNER Ladislav, SILNOVA Anna, PLCHOT Oldřich, NOVOTNÝ Ondřej, ZEINALI Hossein a ROHDIN Johan A.. But System for the Second Dihard Speech Diarization Challenge. In: ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Barcelona: IEEE Signal Processing Society, 2020, s. 6529-6533. ISBN 978-1-5090-6631-5. Dostupné z: https://ieeexplore.ieee.org/document/9054251
Název česky
Systém VUT pro druhou soutěž DIHARD v diarizaci řeči
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Landini Federico Nicolás (UPGM FIT VUT)
Wang Shuai (UPGM FIT VUT)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Žmolíková Kateřina, Ing., Ph.D. (UPGM FIT VUT)
Mošner Ladislav, Ing. (UPGM FIT VUT)
Silnova Anna, MSc., Ph.D. (UPGM FIT VUT)
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Zeinali Hossein, Ph.D. (UPGM FIT VUT)
Rohdin Johan A., Dr. (UPGM FIT VUT)
Wang Shuai (UPGM FIT VUT)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Žmolíková Kateřina, Ing., Ph.D. (UPGM FIT VUT)
Mošner Ladislav, Ing. (UPGM FIT VUT)
Silnova Anna, MSc., Ph.D. (UPGM FIT VUT)
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Zeinali Hossein, Ph.D. (UPGM FIT VUT)
Rohdin Johan A., Dr. (UPGM FIT VUT)
URL
Abstrakt
Tento článek popisuje vítězné systémy vyvinuté společností VUT v Brně pro čtyři běhy druhé soutěže DIHARD v diarizaci řeči. Pro běhy 1 a 2 byly systémy založeny hlavně na základě provádění aglomeračního hierarchického seskupování (AHC) x-vektorů, následovány dalším x-vektorem shlukování založené na Bayesově skrytém Markovově modelu a variační Inferenci Bayes. Poskytujeme srovnání zlepšení dané každým krokem a sdílíme implementaci jádra systému. Pro běhy 3 a 4 s nahrávkami z páté soutěže CHIME jsme prozkoumali různé přístupy k provádění vícekanálové diarizace a náš nejlepší výkon byl dosažen při aplikaci AHC na fúze pravděpodobnostního lineárního diskriminačního prvku na kanál skóre analýzy.
Rok
2020
Strany
6529-6533
Sborník
ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings
Konference
2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), Barcelona, ES
ISBN
978-1-5090-6631-5
Vydavatel
IEEE Signal Processing Society
Místo
Barcelona, ES
DOI
UT WoS
000615970406158
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12281, author = "Nicol\'{a}s Federico Landini and Shuai Wang and Mireia S\'{a}nchez Diez and Luk\'{a}\v{s} Burget and Pavel Mat\v{e}jka and Kate\v{r}ina \v{Z}mol\'{i}kov\'{a} and Ladislav Mo\v{s}ner and Anna Silnova and Old\v{r}ich Plchot and Ond\v{r}ej Novotn\'{y} and Hossein Zeinali and A. Johan Rohdin", title = "But System for the Second Dihard Speech Diarization Challenge", pages = "6529--6533", booktitle = "ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings", year = 2020, location = "Barcelona, ES", publisher = "IEEE Signal Processing Society", ISBN = "978-1-5090-6631-5", doi = "10.1109/ICASSP40776.2020.9054251", language = "english", url = "https://www.fit.vut.cz/research/publication/12281" }