Detail výsledku

Discriminatively Re-trained i-Vector Extractor For Speaker Recognition

NOVOTNÝ, O.; PLCHOT, O.; GLEMBEK, O.; BURGET, L.; MATĚJKA, P. Discriminatively Re-trained i-Vector Extractor For Speaker Recognition. In Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP). Brighton: IEEE Signal Processing Society, 2019. p. 6031-6035. ISBN: 978-1-5386-4658-8.

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Novotný Ondřej, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)

Abstrakt

In this work we revisit discriminative training of the i-vector extractorcomponent in the standard speaker verification (SV) system. Themotivation of our research lies in the robustness and stability of thislarge generative model, which we want to preserve, and focus itspower towards any intended SV task. We show that after generativeinitialization of the i-vector extractor, we can further refine itwith discriminative training and obtain i-vectors that lead to betterperformance on various benchmarks representing different acousticdomains.

Klíčová slova

i-vectors, i-vector extractor, speaker recogni-tion, speaker verification, discriminative training

URL

Rok

2019

Strany

6031–6035

Sborník

Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)

Konference

2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

ISBN

978-1-5386-4658-8

Vydavatel

IEEE Signal Processing Society

Místo

Brighton

DOI

10.1109/ICASSP.2019.8682590

UT WoS

000482554006052

EID Scopus

2-s2.0-85068986459

BibTeX

@inproceedings{BUT160000,
  author="Ondřej {Novotný} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget} and Pavel {Matějka}",
  title="Discriminatively Re-trained i-Vector Extractor For Speaker Recognition",
  booktitle="Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)",
  year="2019",
  pages="6031--6035",
  publisher="IEEE Signal Processing Society",
  address="Brighton",
  doi="10.1109/ICASSP.2019.8682590",
  isbn="978-1-5386-4658-8",
  url="https://ieeexplore.ieee.org/document/8682590"
}

Soubory

pdf novotny_icassp2019_0006031.pdf 274 kB

Projekty

Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
Zpracování, zobrazování a analýza multimediálních a 3D dat, VUT, Vnitřní projekty VUT, FIT-S-17-3984, zahájení: 2017-03-01, ukončení: 2020-02-29, ukončen
Zvýšení spolehlivosti v automatickém rozpoznávání řečníka, GAČR, Juniorské granty, GJ17-23870Y, zahájení: 2017-01-01, ukončení: 2019-12-31, ukončen

Výzkumné skupiny

Výzkumná skupina dolování dat z řeči BUT Speech@FIT (VZ SPEECH)

Pracoviště

Ústav počítačové grafiky a multimédií (UPGM)