Detail výsledku
Phoneme Based Acoustics Keyword Spotting in Informal Continuous Speech
SZŐKE, I.; SCHWARZ, P.; BURGET, L.; KARAFIÁT, M.; MATĚJKA, P.; ČERNOCKÝ, J. Phoneme Based Acoustics Keyword Spotting in Informal Continuous Speech. Lecture Notes in Computer Science, 2005, vol. 2005, no. 3658, p. 302-309. ISSN: 0302-9743.
Typ
článek v časopise
Jazyk
anglicky
Autoři
Szőke Igor, Ing., Ph.D., UPGM (FIT)
Schwarz Petr, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Schwarz Petr, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Abstrakt
This paper describes several ways of acoustic keywords spotting (KWS),based on Gaussian mixture model (GMM) hidden Markov models (HMM) andphoneme posterior probabilities from FeatureNet. Context-independentand dependent phoneme models are used in the GMM/HMM system. Thesystems were trained and evaluated on informal continuous speech. Weused different complexities of KWS recognition network and differenttypes of phoneme models. We study the impact of these parameters on theaccuracy and computational complexity, and conclude that phonemeposteriors outperform conventional GMM/HMM system.
Klíčová slova
acoustic keyword spotting, hidden Markov model, phoneme, recognition network
URL
Rok
2005
Strany
302–309
Časopis
Lecture Notes in Computer Science, roč. 2005, č. 3658, ISSN 0302-9743
BibTeX
@article{BUT42913,
author="Igor {Szőke} and Petr {Schwarz} and Lukáš {Burget} and Martin {Karafiát} and Pavel {Matějka} and Jan {Černocký}",
title="Phoneme Based Acoustics Keyword Spotting in Informal Continuous Speech",
journal="Lecture Notes in Computer Science",
year="2005",
volume="2005",
number="3658",
pages="302--309",
issn="0302-9743",
url="https://www.fit.vut.cz/research/publication/7882/"
}
Projekty
Daty řízené a antropické kódování a rozpoznávání řeči, GAČR, Postdoktorandské granty, GP102/02/D108, zahájení: 2002-09-01, ukončení: 2005-08-30, ukončen
Nové směry ve výzkumu a využití hlasových technologií, GAČR, Standardní projekty, GA102/05/0278, zahájení: 2005-01-01, ukončení: 2007-12-31, ukončen
Posílená skupinová interakce, EU, Sixth Framework programme, 506811-AMI, zahájení: 2004-01-01, ukončení: 2006-12-31, ukončen
Nové směry ve výzkumu a využití hlasových technologií, GAČR, Standardní projekty, GA102/05/0278, zahájení: 2005-01-01, ukončení: 2007-12-31, ukončen
Posílená skupinová interakce, EU, Sixth Framework programme, 506811-AMI, zahájení: 2004-01-01, ukončení: 2006-12-31, ukončen
Výzkumné skupiny
Pracoviště