Detail publikace

End-to-end DNN based text-independent speaker recognition for long and short utterances

ROHDIN Johan A., SILNOVA Anna, DIEZ Sánchez Mireia, PLCHOT Oldřich, MATĚJKA Pavel, BURGET Lukáš a GLEMBEK Ondřej. End-to-end DNN based text-independent speaker recognition for long and short utterances. Computer Speech and Language, roč. 2020, č. 59, s. 22-35. ISSN 0885-2308. Dostupné z: https://www.sciencedirect.com/science/article/pii/S0885230818303632
Název česky
Rozpoznávání mluvčího závislé na textu založené na End-to-end DNN přístupu pro dlouhé a krátké promluvy
Typ
článek v časopise
Jazyk
angličtina
Autoři
URL
Abstrakt

Nedávno bylo navrženo několik systémů ověřování koncového mluvčího založených na hlubokých neuronových sítích (DNN). Ukázalo se, že tyto systémy jsou konkurenceschopné jak pro textově závislé úkoly, tak pro textově nezávislé úlohy s krátkými promluvami. U textově nezávislých úkolů s delšími promluvami jsou však systémy typu end-to-end stále lepší než standardní systémy i-vector + PLDA. V této práci představujeme end-to-end systém ověřování mluvčího, který je inicializován tak, aby napodoboval základní linii i-vektor + PLDA. Systém je poté dále trénován od začátku do konce, ale je upraven tak, aby se neodchyloval příliš daleko od počátečního systému. Tímto způsobem snižujeme nadměrné vybavení, které normálně omezuje výkonnost systémů end-to-end. Navrhovaný systém překonává základní linii i-vektor + PLDA na promluvách o dlouhém i krátkém trvání.

Rok
2020
Strany
22-35
Časopis
Computer Speech and Language, roč. 2020, č. 59, ISSN 0885-2308
Vydavatel
Elsevier Science
DOI
UT WoS
000490540900002
EID Scopus
BibTeX
@ARTICLE{FITPUB12038,
   author = "A. Johan Rohdin and Anna Silnova and Mireia S\'{a}nchez Diez and Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Luk\'{a}\v{s} Burget and Ond\v{r}ej Glembek",
   title = "End-to-end DNN based text-independent speaker recognition for long and short utterances",
   pages = "22--35",
   journal = "Computer Speech and Language",
   volume = 2020,
   number = 59,
   year = 2020,
   ISSN = "0885-2308",
   doi = "10.1016/j.csl.2019.06.002",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12038"
}
Nahoru