Detail výsledku

Discriminatively Re-trained i-Vector Extractor For Speaker Recognition

NOVOTNÝ, O.; PLCHOT, O.; GLEMBEK, O.; BURGET, L.; MATĚJKA, P. Discriminatively Re-trained i-Vector Extractor For Speaker Recognition. In Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP). Brighton: IEEE Signal Processing Society, 2019. p. 6031-6035. ISBN: 978-1-5386-4658-8.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Novotný Ondřej, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Abstrakt

In this work we revisit discriminative training of the i-vector extractorcomponent in the standard speaker verification (SV) system. Themotivation of our research lies in the robustness and stability of thislarge generative model, which we want to preserve, and focus itspower towards any intended SV task. We show that after generativeinitialization of the i-vector extractor, we can further refine itwith discriminative training and obtain i-vectors that lead to betterperformance on various benchmarks representing different acousticdomains.

Klíčová slova

i-vectors, i-vector extractor, speaker recogni-tion, speaker verification, discriminative training

URL
Rok
2019
Strany
6031–6035
Sborník
Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)
Konference
2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton
DOI
UT WoS
000482554006052
EID Scopus
BibTeX
@inproceedings{BUT160000,
  author="Ondřej {Novotný} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget} and Pavel {Matějka}",
  title="Discriminatively Re-trained i-Vector Extractor For Speaker Recognition",
  booktitle="Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)",
  year="2019",
  pages="6031--6035",
  publisher="IEEE Signal Processing Society",
  address="Brighton",
  doi="10.1109/ICASSP.2019.8682590",
  isbn="978-1-5386-4658-8",
  url="https://ieeexplore.ieee.org/document/8682590"
}
Soubory
Projekty
Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
Zpracování, zobrazování a analýza multimediálních a 3D dat, VUT, Vnitřní projekty VUT, FIT-S-17-3984, zahájení: 2017-03-01, ukončení: 2020-02-29, ukončen
Zvýšení spolehlivosti v automatickém rozpoznávání řečníka, GAČR, Juniorské granty, GJ17-23870Y, zahájení: 2017-01-01, ukončení: 2019-12-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru