Detail výsledku

Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery

ONDEL YANG, L.; VYDANA, H.; BURGET, L.; ČERNOCKÝ, J. Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery. In Proceedings of Interspeech 2019. Proceedings of Interspeech. Graz: International Speech Communication Association, 2019. no. 9, p. 261-265. ISSN: 1990-9772.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Ondel Lucas Antoine Francois, Mgr., Ph.D., UPGM (FIT)
Vydana Hari Krishna, UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Abstrakt

This work tackles the problem of learning a set of language specificacoustic units from unlabeled speech recordings given aset of labeled recordings from other languages. Our approachmay be described by the following two steps procedure: firstthe model learns the notion of acoustic units from the labelleddata and then the model uses its knowledge to find new acousticunits on the target language. We implement this processwith the Bayesian Subspace Hidden Markov Model (SHMM), amodel akin to the Subspace Gaussian Mixture Model (SGMM)where each low dimensional embedding represents an acousticunit rather than just a HMMs state. The subspace is trainedon 3 languages from the GlobalPhone corpus (German, Polishand Spanish) and the AUs are discovered on the TIMIT corpus.Results, measured in equivalent Phone Error Rate, show thatthis approach significantly outperforms previous HMM basedacoustic units discovery systems and compares favorably withthe Variational Auto Encoder-HMM.

Klíčová slova

Bayesian Inference, Hidden Markov Model,Subspace Model, Variational Bayes, Low-resource languages,Acoustic Unit Discovery

URL
Rok
2019
Strany
261–265
Časopis
Proceedings of Interspeech, roč. 2019, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2019
Konference
Interspeech Conference
Vydavatel
International Speech Communication Association
Místo
Graz
DOI
UT WoS
000831796400053
EID Scopus
BibTeX
@inproceedings{BUT159991,
  author="Lucas Antoine Francois {Ondel} and Hari Krishna {Vydana} and Lukáš {Burget} and Jan {Černocký}",
  title="Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery",
  booktitle="Proceedings of Interspeech 2019",
  year="2019",
  journal="Proceedings of Interspeech",
  volume="2019",
  number="9",
  pages="261--265",
  publisher="International Speech Communication Association",
  address="Graz",
  doi="10.21437/Interspeech.2019-2224",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2019/pdfs/2224.pdf"
}
Soubory
Projekty
Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
IARPA Strojový překlad pro anglické vyhledávání informací v libovolném jazyce (MATERIAL) - Automatické vyhledávání informací v cizím jazyce (FLAIR), IARPA, zahájení: 2017-09-21, ukončení: 2021-10-22, ukončen
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
Neuronové reprezentace v multimodálním a mnohojazyčném modelování, GAČR, Grantové projekty exelence v základním výzkumu EXPRO - 2019, GX19-26934X, zahájení: 2019-01-01, ukončení: 2023-12-31, ukončen
Zpracování, zobrazování a analýza multimediálních a 3D dat, VUT, Vnitřní projekty VUT, FIT-S-17-3984, zahájení: 2017-03-01, ukončení: 2020-02-29, ukončen
Výzkumné skupiny
Pracoviště
Nahoru