Detail výsledku
iVector Fusion of Prosodic and Cepstral Features for Speaker Verification
KOCKMANN, M.; FERRER, L.; BURGET, L.; ČERNOCKÝ, J. iVector Fusion of Prosodic and Cepstral Features for Speaker Verification. Proceedings of Interspeech 2011. Proceedings of Interspeech. Florence: International Speech Communication Association, 2011. no. 8, p. 265-268. ISBN: 978-1-61839-270-1. ISSN: 1990-9772.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Kockmann Marcel, Dipl.-Ing., Ph.D., FIT (FIT)
Ferrer Luciana
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Ferrer Luciana
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Abstrakt
This publication is about the first results on the use of total variability modelingof the mean supervector space for a set of prosodic features.We show that this iVector approach outperforms the standardJFA approach originally proposed for these features. We notethat this improvement over JFA is observed only when the iVectorsare modeled using the PLDA back end.
Klíčová slova
speaker verification, prosody, JFA, iVector, SMM, fusion
URL
Rok
2011
Strany
265–268
Časopis
Proceedings of Interspeech, roč. 2011, č. 8, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2011
Konference
Interspeech Conference
ISBN
978-1-61839-270-1
Vydavatel
International Speech Communication Association
Místo
Florence
BibTeX
@inproceedings{BUT76448,
author="Marcel {Kockmann} and Luciana {Ferrer} and Lukáš {Burget} and Jan {Černocký}",
title="iVector Fusion of Prosodic and Cepstral Features for Speaker Verification",
booktitle="Proceedings of Interspeech 2011",
year="2011",
journal="Proceedings of Interspeech",
volume="2011",
number="8",
pages="265--268",
publisher="International Speech Communication Association",
address="Florence",
isbn="978-1-61839-270-1",
issn="1990-9772",
url="http://www.fit.vutbr.cz/research/groups/speech/publi/2011/kockmann_interspeech2011_677.pdf"
}
Projekty
IARPA Využití vědy a technologií v biometrii (BEST) - Zvyšování robustnosti v modelování mluvčího (PRISM), IARPA, zahájení: 2009-12-07, ukončení: 2011-12-30, ukončen
Rozpoznávání mluvené řeči v reálných podmínkách, GAČR, Standardní projekty, GA102/08/0707, zahájení: 2008-01-01, ukončení: 2011-12-31, ukončen
Teorie a aplikace odhadu posteriorních pravděpodobností fonémů ve zpracování řeči, GAČR, Doktorské granty, GP102/09/P635, zahájení: 2009-01-01, ukončení: 2011-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Rozpoznávání mluvené řeči v reálných podmínkách, GAČR, Standardní projekty, GA102/08/0707, zahájení: 2008-01-01, ukončení: 2011-12-31, ukončen
Teorie a aplikace odhadu posteriorních pravděpodobností fonémů ve zpracování řeči, GAČR, Doktorské granty, GP102/09/P635, zahájení: 2009-01-01, ukončení: 2011-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkumné skupiny
Pracoviště