Detail publikace
Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
V této práci pokračujeme v našem výzkumu i-vektorového extraktoru pro ověřování mluvčího (SV) a optimalizujeme jeho architekturu pro rychlé a efektivní diskriminační školení. Byli jsme motivováni výpočetními a paměťovými požadavky způsobenými velkým počtem parametrů původního generativního modelu vektoru. Naším cílem je zachovat sílu původního generativního modelu a současně model zaměřit na extrakci informací souvisejících s mluvčím. Ukazujeme, že je možné reprezentovat standardní generativní i-vektorový extraktor modelem s výrazně méně parametry a získat podobný výkon na SV úlohách. Můžeme dále vylepšit tento kompaktní model diskriminačním tréninkem a získat i-vektory, které vedou k lepšímu výkonu na různých SV benchmarcích představujících různé akustické domény.
@INPROCEEDINGS{FITPUB12091, author = "Ond\v{r}ej Novotn\'{y} and Old\v{r}ich Plchot and Ond\v{r}ej Glembek and Luk\'{a}\v{s} Burget", title = "Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition", pages = "4330--4334", booktitle = "Proceedings of Interspeech", journal = "Proceedings of Interspeech - on-line", volume = 2019, number = 9, year = 2019, location = "Graz, AT", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2019-1757", language = "english", url = "https://www.fit.vut.cz/research/publication/12091" }