Detail výsledku

The subspace Gaussian mixture model-A structured model for speech recognition

POVEY, D.; BURGET, L.; AGARWAL, M.; AKYAZI, P.; GHOSHAL, A.; GLEMBEK, O.; GOEL, N.; KARAFIÁT, M.; RASTROW, A.; ROSE, R.; SCHWARZ, P.; THOMAS, S. The subspace Gaussian mixture model-A structured model for speech recognition. COMPUTER SPEECH AND LANGUAGE, 2011, vol. 25, no. 2, p. 404-439. ISSN: 0885-2308.
Typ
článek v časopise
Jazyk
anglicky
Autoři
Povey Daniel
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Agarwal Mohit
Akyazi Pinar
Ghoshal Arnab
Glembek Ondřej, Ing., Ph.D., FIT (FIT), UPGM (FIT)
Goel Nagendra
Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Rastrow Ariya
Rose Richard
Schwarz Petr, Ing., Ph.D., UPGM (FIT)
Thomas Samuel
a další
Abstrakt

Speech recognition based on the Hidden Markov Model-Gaussian Mixture Model (HMM-GMM) framework generally involves training a completely separate GMM in each HMM state.We introduce a model in which the HMM states share a common structure but the means and mixture weights are allowed to vary in a subspace of the full parameter space, controlled by a global mapping from a vector space to the space of GMM parameters.

Klíčová slova

Speech recognition; Gaussian Mixture Model; Subspace Gaussian Mixture Model

URL
Rok
2011
Strany
404–439
Časopis
COMPUTER SPEECH AND LANGUAGE, roč. 25, č. 2, ISSN 0885-2308
Kniha
Computer Speech & Language, Volume 25, Issue 2, April 2011
Vydavatel
Elsevier Science
UT WoS
000284670200017
EID Scopus
BibTeX
@article{BUT76383,
  author="Daniel {Povey} and Lukáš {Burget} and Mohit {Agarwal} and Pinar {Akyazi} and Arnab {Ghoshal} and Ondřej {Glembek} and Nagendra {Goel} and Martin {Karafiát} and Ariya {Rastrow} and Richard {Rose} and Petr {Schwarz} and Samuel {Thomas}",
  title="The subspace Gaussian mixture model-A structured model for speech recognition",
  journal="COMPUTER SPEECH AND LANGUAGE",
  year="2011",
  volume="25",
  number="2",
  pages="404--439",
  issn="0885-2308",
  url="https://www.fit.vut.cz/research/publication/9670/"
}
Projekty
Multiligvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky, MPO, TIP, FR-TI1/034, zahájení: 2009-09-01, ukončení: 2013-08-31, ukončen
Rozpoznávání mluvené řeči v reálných podmínkách, GAČR, Standardní projekty, GA102/08/0707, zahájení: 2008-01-01, ukončení: 2011-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkumné skupiny
Pracoviště
Nahoru