Detail publikace
End-to-end DNN based text-independent speaker recognition for long and short utterances
Silnova Anna, MSc., Ph.D. (UPGM FIT VUT)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM FIT VUT)
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Nedávno bylo navrženo několik systémů ověřování koncového mluvčího založených na hlubokých neuronových sítích (DNN). Ukázalo se, že tyto systémy jsou konkurenceschopné jak pro textově závislé úkoly, tak pro textově nezávislé úlohy s krátkými promluvami. U textově nezávislých úkolů s delšími promluvami jsou však systémy typu end-to-end stále lepší než standardní systémy i-vector + PLDA. V této práci představujeme end-to-end systém ověřování mluvčího, který je inicializován tak, aby napodoboval základní linii i-vektor + PLDA. Systém je poté dále trénován od začátku do konce, ale je upraven tak, aby se neodchyloval příliš daleko od počátečního systému. Tímto způsobem snižujeme nadměrné vybavení, které normálně omezuje výkonnost systémů end-to-end. Navrhovaný systém překonává základní linii i-vektor + PLDA na promluvách o dlouhém i krátkém trvání.
@ARTICLE{FITPUB12038, author = "A. Johan Rohdin and Anna Silnova and Mireia S\'{a}nchez Diez and Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Luk\'{a}\v{s} Burget and Ond\v{r}ej Glembek", title = "End-to-end DNN based text-independent speaker recognition for long and short utterances", pages = "22--35", journal = "Computer Speech and Language", volume = 2020, number = 59, year = 2020, ISSN = "0885-2308", doi = "10.1016/j.csl.2019.06.002", language = "english", url = "https://www.fit.vut.cz/research/publication/12038" }