Detail výsledku
BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020
Silnova Anna, M.Sc., Ph.D., UPGM (FIT)
Pulugundla Bhargav, M.Sc., UPGM (FIT)
Rohdin Johan Andréas, M.Sc., Ph.D., FIT (FIT), UPGM (FIT)
Veselý Karel, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Novotný Ondřej, Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
In this paper, we present the winning BUT submission for thetext-dependent task of the SdSV challenge 2020. Given thelarge amount of training data available in this challenge, we exploresuccessful techniques from text-independent systems inthe text-dependent scenario. In particular, we trained x-vectorextractors on both in-domain and out-of-domain datasets andcombine them with i-vectors trained on concatenated MFCCsand bottleneck features, which have proven effective for thetext-dependent scenario. Moreover, we proposed the use ofphrase-dependent PLDA backend for scoring and its combinationwith a simple phrase recognizer, which brings up to 63%relative improvement on our development set with respect to usingstandard PLDA. Finally, we combine our different i-vectorand x-vector based systems using a simple linear logistic regressionscore level fusion, which provides 28% relative improvementon the evaluation set with respect to our best singlesystem.
text-dependent speaker verification, phrasedependentPLDA, phrase recognizer
@inproceedings{BUT168145,
author="Alicia {Lozano Díez} and Anna {Silnova} and Bhargav {Pulugundla} and Johan Andréas {Rohdin} and Karel {Veselý} and Lukáš {Burget} and Oldřich {Plchot} and Ondřej {Glembek} and Ondřej {Novotný} and Pavel {Matějka}",
title="BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020",
booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
year="2020",
journal="Proceedings of Interspeech",
volume="2020",
number="10",
pages="761--765",
publisher="International Speech Communication Association",
address="Shanghai",
doi="10.21437/Interspeech.2020-2882",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2020/pdfs/2882.pdf"
}
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
Moderní metody zpracování, analýzy a zobrazování multimediálních a 3D dat, VUT, Vnitřní projekty VUT, FIT-S-20-6460, zahájení: 2020-03-01, ukončení: 2023-02-28, ukončen
Multi-lingualita v řečových technologiích, MŠMT, INTER-EXCELLENCE - Podprogram INTER-ACTION, LTAIN19087, zahájení: 2020-01-01, ukončení: 2023-08-31, ukončen
Neuronové reprezentace v multimodálním a mnohojazyčném modelování, GAČR, Grantové projekty exelence v základním výzkumu EXPRO - 2019, GX19-26934X, zahájení: 2019-01-01, ukončení: 2023-12-31, ukončen
Robustní rozpoznávání SPEAKER na základě modelů hlubokého učení a pozornosti, EU, Horizon 2020, zahájení: 2019-06-01, ukončení: 2021-01-31, ukončen
Síťová, textová analýza a analýza řeči v reálném čase pro boj s organizovaným zločinem, EU, Horizon 2020, zahájení: 2019-09-01, ukončení: 2022-12-31, ukončen
Zapojení umělé inteligence do příjmu tísňového volání, MV, Program bezpečnostního výzkumu ČR v letech 2015-2022 (BV III/1-VS), VI20192022169, zahájení: 2019-07-04, ukončení: 2022-05-31, ukončen