Detail publikace

Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition

NOVOTNÝ Ondřej, PLCHOT Oldřich, GLEMBEK Ondřej a BURGET Lukáš. Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition. In: Proceedings of Interspeech. Graz: International Speech Communication Association, 2019, s. 4330-4334. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1757.pdf
Název česky
Faktorizace diskriminativně trénovaného extraktoru i-vektorů pro rozpoznávání mluvčího
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

V této práci pokračujeme v našem výzkumu i-vektorového extraktoru pro ověřování mluvčího (SV) a optimalizujeme jeho architekturu pro rychlé a efektivní diskriminační školení. Byli jsme motivováni výpočetními a paměťovými požadavky způsobenými velkým počtem parametrů původního generativního modelu vektoru. Naším cílem je zachovat sílu původního generativního modelu a současně model zaměřit na extrakci informací souvisejících s mluvčím. Ukazujeme, že je možné reprezentovat standardní generativní i-vektorový extraktor modelem s výrazně méně parametry a získat podobný výkon na SV úlohách. Můžeme dále vylepšit tento kompaktní model diskriminačním tréninkem a získat i-vektory, které vedou k lepšímu výkonu na různých SV benchmarcích představujících různé akustické domény.

Rok
2019
Strany
4330-4334
Časopis
Proceedings of Interspeech - on-line, roč. 2019, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech
Konference
Interspeech Conference, Graz, AT
Vydavatel
International Speech Communication Association
Místo
Graz, AT
DOI
UT WoS
000831796404095
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12091,
   author = "Ond\v{r}ej Novotn\'{y} and Old\v{r}ich Plchot and Ond\v{r}ej Glembek and Luk\'{a}\v{s} Burget",
   title = "Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition",
   pages = "4330--4334",
   booktitle = "Proceedings of Interspeech",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2019,
   number = 9,
   year = 2019,
   location = "Graz, AT",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2019-1757",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12091"
}
Nahoru