Detail publikace

Discriminatively Re-trained i-Vector Extractor For Speaker Recognition

NOVOTNÝ Ondřej, PLCHOT Oldřich, GLEMBEK Ondřej, BURGET Lukáš a MATĚJKA Pavel. Discriminatively Re-trained i-Vector Extractor For Speaker Recognition. In: Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP). Brighton: IEEE Signal Processing Society, 2019, s. 6031-6035. ISBN 978-1-5386-4658-8. Dostupné z: https://ieeexplore.ieee.org/document/8682590
Název česky
Diskriminativně přetrénovaný extraktor i-vektorů pro rozpoznávání mluvčího
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

Tento článek pojednává o diskriminativně přetrénovaném extraktoru i-vektorů pro rozpoznávání mluvčího.V této práci se znovu věnujeme diskriminačnímu tréninku komponenty i-vektorového extraktoru v systému standardního ověřování mluvčích (SV). Motivace našeho výzkumu spočívá v robustnosti a stabilitě tohoto velkého generativního modelu, který chceme zachovat, a zaměřit jeho sílu na jakýkoli zamýšlený úkol SV. Ukazujeme, že po generativní inicializaci i-vektorového extraktoru ji můžeme dále zdokonalit diskriminačním tréninkem a získat i-vektory, které vedou k lepšímu výkonu na různých benchmarcích představujících různé akustické domény.

Rok
2019
Strany
6031-6035
Sborník
Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)
Konference
2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), Brighton, GB
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton, GB
DOI
UT WoS
000482554006052
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12093,
   author = "Ond\v{r}ej Novotn\'{y} and Old\v{r}ich Plchot and Ond\v{r}ej Glembek and Luk\'{a}\v{s} Burget and Pavel Mat\v{e}jka",
   title = "Discriminatively Re-trained i-Vector Extractor For Speaker Recognition",
   pages = "6031--6035",
   booktitle = "Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)",
   year = 2019,
   location = "Brighton, GB",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-5386-4658-8",
   doi = "10.1109/ICASSP.2019.8682590",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12093"
}
Nahoru