Detail výsledku
Analysis of the DNN-Based SRE Systems in Multi-language Conditions
NOVOTNÝ, O.; MATĚJKA, P.; GLEMBEK, O.; PLCHOT, O.; GRÉZL, F.; BURGET, L.; ČERNOCKÝ, J. Analysis of the DNN-Based SRE Systems in Multi-language Conditions. In Proceedings of SLT 2016. San Diego: IEEE Signal Processing Society, 2016. p. 199-204. ISBN: 978-1-5090-4903-5.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Novotný Ondřej, Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Grézl František, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Grézl František, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Abstrakt
This paper analyzes the behavior of our state-of-the-art Deep Neural Network/i-vector/PLDA-based speaker recognition systems in multi-language conditions. On the "Language Pack" of the PRISM set, we evaluate the systems performance using the NISTs standard metrics. We show that not only the gain from using DNNs vanishes, nor using dedicated DNNs for target conditions helps, but also the DNN-based systems tend to produce de-calibrated scores under the studied conditions. This work gives suggestions for directions of future research rather than any particular solutions to these issues.
Klíčová slova
DNN, Multi-Language, Speaker Recognition
URL
Rok
2016
Strany
199–204
Sborník
Proceedings of SLT 2016
Konference
2016 IEEE Workshop on Spoken Language Technology
ISBN
978-1-5090-4903-5
Vydavatel
IEEE Signal Processing Society
Místo
San Diego
DOI
UT WoS
000399128000029
EID Scopus
BibTeX
@inproceedings{BUT132603,
author="Ondřej {Novotný} and Pavel {Matějka} and Ondřej {Glembek} and Oldřich {Plchot} and František {Grézl} and Lukáš {Burget} and Jan {Černocký}",
title="Analysis of the DNN-Based SRE Systems in Multi-language Conditions",
booktitle="Proceedings of SLT 2016",
year="2016",
pages="199--204",
publisher="IEEE Signal Processing Society",
address="San Diego",
doi="10.1109/slt.2016.7846265",
isbn="978-1-5090-4903-5",
url="http://ieeexplore.ieee.org/document/7846265/"
}
Soubory
Projekty
Analytika velkých řečových dat pro kontaktní centra, EU, Horizon 2020, zahájení: 2015-01-01, ukončení: 2017-12-31, ukončen
DARPA - Robustní automatický přepis řeči (RATS) - RATS Patrol II, BBN, zahájení: 2015-02-23, ukončení: 2017-03-31, ukončen
Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
IARPA Tvorba rozpoznávačů řeči pro vyhledávání klíčových slov v novém jazyce s omezenými trénovacími daty za týden (BABEL) - Babelon, BBN, zahájení: 2012-03-05, ukončení: 2016-11-04, ukončen
DARPA - Robustní automatický přepis řeči (RATS) - RATS Patrol II, BBN, zahájení: 2015-02-23, ukončení: 2017-03-31, ukončen
Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
IARPA Tvorba rozpoznávačů řeči pro vyhledávání klíčových slov v novém jazyce s omezenými trénovacími daty za týden (BABEL) - Babelon, BBN, zahájení: 2012-03-05, ukončení: 2016-11-04, ukončen
Výzkumné skupiny
Pracoviště