Detail výsledku

Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge

NOVOTNÝ, O.; MATĚJKA, P.; PLCHOT, O.; GLEMBEK, O.; BURGET, L.; ČERNOCKÝ, J. Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge. In Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016. p. 828-832. ISBN: 978-1-5108-3313-5.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Novotný Ondřej, Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Abstrakt

In this paper, we summarize our efforts for the Speakers InThe Wild (SITW) challenge, and we present our findings withthis new dataset for speaker recognition. Apart from the standardcomparison of different SRE systems, we analyze the useof diarization for dealing with audio segments containing multiplespeakers, as in part of the newly introduced enrollmentand test protocols, diarization is a necessary system component.Our state-of-the-art systems used in this work utilize bothcepstral and DNN-based bottleneck features and are based oni-vectors followed by Probabilistic Linear Discriminant Analysis(PLDA) classifier and logistic regression calibration/fusion.We present both narrow-band (8 kHz) and wide-band (16 kHz)systems together with their fusions.

Klíčová slova

speaker recognition, SRE systems, diarization

URL
Rok
2016
Strany
828–832
Sborník
Proceedings of Interspeech 2016
Konference
Interspeech Conference
ISBN
978-1-5108-3313-5
Vydavatel
International Speech Communication Association
Místo
San Francisco
DOI
UT WoS
000409394400173
EID Scopus
BibTeX
@inproceedings{BUT132599,
  author="Ondřej {Novotný} and Pavel {Matějka} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget} and Jan {Černocký}",
  title="Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge",
  booktitle="Proceedings of Interspeech 2016",
  year="2016",
  pages="828--832",
  publisher="International Speech Communication Association",
  address="San Francisco",
  doi="10.21437/Interspeech.2016-981",
  isbn="978-1-5108-3313-5",
  url="https://www.researchgate.net/publication/307889224_Analysis_of_Speaker_Recognition_Systems_in_Realistic_Scenarios_of_the_SITW_2016_Challenge"
}
Soubory
Projekty
DARPA - Robustní automatický přepis řeči (RATS) - RATS Patrol II, BBN, zahájení: 2015-02-23, ukončení: 2017-03-31, ukončen
Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
Zpracování, rozpoznávání a zobrazování multimediálních a 3D dat, VUT, Vnitřní projekty VUT, FIT-S-14-2506, zahájení: 2014-01-01, ukončení: 2016-12-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru