Detail publikace

Sequence Summarizing Neural Networks for Spoken Language Recognition

PEŠÁN, J.; BURGET, L.; ČERNOCKÝ, J. Sequence Summarizing Neural Networks for Spoken Language Recognition. In Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016. p. 3285-3289. ISBN: 978-1-5108-3313-5.

Název česky

Sekvenční sumarizační neuronové sítě pro rozpoznávání mluveného jazyka

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Pešán Jan, Ing. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)

URL

Klíčová slova

Sequence Summarizing Neural Network, DNN,i-vectors

Abstrakt

Tento článek zkoumá použití Sequence Summarizing NeuralSítě (SSNN) jako varianta hlubokých neuronových sítí(DNN) pro klasifikaci sekvencí. V této práci je aplikovának rozpoznávání mluveného jazyka. Na rozdíl od jiné klasifikaceúkoly při zpracování řeči tam, kde to DNN potřebujeprodukují výstup na snímek, jazyk je považován za konstantníběhem promluvy. Zavádíme souhrnnou komponentudo struktury DNN produkující jednu sadu jazykových posteriorůza promluvu. Výcvik DNN provádívhodně upravený algoritmus přechodu a sestupu. V našempočáteční experimenty jsou výsledky SSNN porovnány s jedinýmnejmodernější základní systém založený na i-vektorech s podobnýmsložitost (tj. žádná fúze systému atd.). Za určitých podmínekSSNN jsou schopny poskytovat výkon srovnatelný se základní úrovníSystém. Relativního zlepšení až o 30% se dosáhne sfúze úrovně skóre základní linie a systémů SSNN.

Rok

2016

Strany

3285–3289

Sborník

Proceedings of Interspeech 2016

Konference

17. mezinárodní ISCA konference o hlasové komunikaci (Interspeech 2016), San Francisco, US

ISBN

978-1-5108-3313-5

Vydavatel

International Speech Communication Association

Místo

San Francisco

DOI

10.21437/Interspeech.2016-764

UT WoS

000409394402038

EID Scopus

2-s2.0-84994361899

BibTeX

@inproceedings{BUT131019,
  author="Jan {Pešán} and Lukáš {Burget} and Jan {Černocký}",
  title="Sequence Summarizing Neural Networks for Spoken Language Recognition",
  booktitle="Proceedings of Interspeech 2016",
  year="2016",
  pages="3285--3289",
  publisher="International Speech Communication Association",
  address="San Francisco",
  doi="10.21437/Interspeech.2016-764",
  isbn="978-1-5108-3313-5",
  url="https://www.researchgate.net/publication/307889421_Sequence_Summarizing_Neural_Networks_for_Spoken_Language_Recognition"
}

Soubory

pdf pesan_interspeech2016_IS160764.pdf 234 kB