Detail publikace
On the use of X-vectors for Robust Speaker Recognition
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Mošner Ladislav, Ing. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Textově nezávislé ověřování mluvčích (SV) je v současné době v procesu přijímání DNN modelování v každé fázi systému SV. Přístupy založené na DNN, jako je end-to-end modelování a systémy založené na vkládání DNN, pomalu začínají být konkurenceschopné i v náročných a rozmanitých podmínkách kanálu nedávných SRN NIST. Přizpůsobení domény a potřeba velkého množství tréninkových dat jsou stále výzvou pro současné diskriminační systémy a (na rozdíl od generativních modelů) vidíme významné zisky z rozšiřování dat, simulace a dalších technik určených k překonání nedostatku tréninkových dat. Představujeme analýzu systému SV založeného na vložení DNN (vektory x) a zaměřujeme se na robustnost napříč různými datovými doménami, jako jsou standardní telefonní a mikrofonní konverzace, a to jak v čistém, hlučném, tak i reverberantním prostředí. Vyhodnocujeme také systém podle náročných dat ze vzdáleného pole vytvořených opětovným přenosem podmnožiny rozhovorů s mikrofony NIST SRE 2008 a 2010. Porovnáváme naše výsledky s nejmodernějším i-vektorovým systémem. Obecně jsme byli schopni dosáhnout lepšího výkonu se systémy založenými na DNN, ale co je nejdůležitější, potvrdili jsme robustnost těchto systémů napříč více datovými doménami.
@INPROCEEDINGS{FITPUB11787, author = "Ond\v{r}ej Novotn\'{y} and Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Ladislav Mo\v{s}ner and Ond\v{r}ej Glembek", title = "On the use of X-vectors for Robust Speaker Recognition", pages = "168--175", booktitle = "Proceedings of Odyssey 2018", journal = "Proceedings of Odyssey: The Speaker and Language Recognition Workshop", volume = 2018, number = 6, year = 2018, location = "Les Sables dOlonne, FR", publisher = "International Speech Communication Association", ISSN = "2312-2846", doi = "10.21437/Odyssey.2018-24", language = "english", url = "https://www.fit.vut.cz/research/publication/11787" }