Detail publikace

Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery

ONDEL Yang Lucas Antoine Francois, VYDANA Hari K., BURGET Lukáš a ČERNOCKÝ Jan. Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery. In: Proceedings of Interspeech 2019. Graz: International Speech Communication Association, 2019, s. 261-265. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/Interspeech_2019/pdfs/2224.pdf
Název česky
Bayesovský podprostorový skrytý Markovův model pro objevování akustických jednotek
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

Tato práce řeší problém učení sady jazykově specifických akustických jednotek z neoznačených záznamů řeči, které jsou dány souborem označených nahrávek z jiných jazyků. Náš přístup lze popsat v následujících dvou krocích: nejprve se model naučí pojem akustických jednotek z označených dat a poté model použije své znalosti k nalezení nových akustických jednotek v cílovém jazyce. Implementujeme tento proces s Bayesian Subspace Hidden Markov Model (SHMM), což je model podobný modelu Subspace Gaussian Mixture (SGMM), kde každé nízkodimenzionální vložení představuje spíše akustickou jednotku než jen stav HMM. Podprostor je proškolen ve 3 jazycích z korpusu GlobalPhone (němčina, polština a španělština) a AU jsou objeveny v korpusu TIMIT. Výsledky měřené ekvivalentní četností chyb telefonů ukazují, že tento přístup výrazně překonává předchozí systémy zjišťování akustických jednotek založené na HMM a je příznivě srovnatelné s Variational Auto Encoder-HMM.

Rok
2019
Strany
261-265
Časopis
Proceedings of Interspeech - on-line, roč. 2019, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2019
Konference
Interspeech Conference, Graz, AT
Vydavatel
International Speech Communication Association
Místo
Graz, AT
DOI
UT WoS
000831796400053
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12084,
   author = "Francois Antoine Lucas Yang Ondel and K. Hari Vydana and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}",
   title = "Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery",
   pages = "261--265",
   booktitle = "Proceedings of Interspeech 2019",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2019,
   number = 9,
   year = 2019,
   location = "Graz, AT",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2019-2224",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12084"
}
Nahoru