Detail publikace

Text-dependent speaker verification based on i-vectors, Neural Networks and Hidden Markov Models

ZEINALI Hossein, SAMETI Hossein, BURGET Lukáš a ČERNOCKÝ Jan. Text-dependent speaker verification based on i-vectors, Neural Networks and Hidden Markov Models. Computer Speech and Language, roč. 2017, č. 46, s. 53-71. ISSN 0885-2308. Dostupné z: http://www.sciencedirect.com/science/article/pii/S0885230816303199
Název česky
Ověřování mluvčího závislé na textu založené na i-vektorech, neuronových sítích a skrytých Markovových modelech
Typ
článek v časopise
Jazyk
angličtina
Autoři
Zeinali Hossein, Ph.D. (UPGM FIT VUT)
Sameti Hossein (SHARIF)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
URL
Abstrakt

Inspirováni úspěchem Deep Neural Networks (DNN) v rozpoznávání řečníků nezávislých na textu jsme nedávno prokázali, že podobné myšlenky lze aplikovat také na ověřovací úlohu řečníka závislého na textu. V tomto článku popisujeme nové pokroky v našem nejmodernějším přístupu založeném na i-vektorech k verifikaci řečníka závislého na textu, který také využívá různé techniky DNN. Aby bylo možné shromáždit dostatečné statistiky pro extrakci i-vektorů, porovnávají se různé modely zarovnání rámců, jako jsou GMM, phonemic HMM nebo DNN trénované pro klasifikaci senonu. Rovněž experimentujeme s funkcemi úzkých míst založenými na DNN a jejich kombinacemi se standardními funkcemi MFCC. Experimentujeme s několika různými konfiguracemi DNN a zkoumáme důležitost tréninku DNN na 16kHz řeči. Výsledky jsou uvedeny v datové sadě RSR2015, kde je k dispozici školicí materiál pro všechny možné registrační a testovací fráze. Kromě toho vykazujeme výsledky také u náročnějších datových sad RedDots, kde je systém postaven skutečně nezávisle na frázi.

Rok
2017
Strany
53-71
Časopis
Computer Speech and Language, roč. 2017, č. 46, ISSN 0885-2308
Vydavatel
Elsevier Science
DOI
UT WoS
000407609600003
EID Scopus
BibTeX
@ARTICLE{FITPUB11529,
   author = "Hossein Zeinali and Hossein Sameti and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}",
   title = "Text-dependent speaker verification based on i-vectors, Neural Networks and Hidden Markov Models",
   pages = "53--71",
   journal = "Computer Speech and Language",
   volume = 2017,
   number = 46,
   year = 2017,
   ISSN = "0885-2308",
   doi = "10.1016/j.csl.2017.04.005",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11529"
}
Nahoru