Detail výsledku

The Kaldi Speech Recognition Toolkit

POVEY, D.; GHOSHAL, A.; BOULIANNE, G.; BURGET, L.; GLEMBEK, O.; GOEL, N.; HANNEMANN, M.; MOTLÍČEK, P.; QIAN, Y.; SCHWARZ, P.; SILOVSKÝ, J.; STEMMER, G.; VESELÝ, K. The Kaldi Speech Recognition Toolkit. Proceedings of ASRU 2011. Hilton Waikoloa Village Resort, Hawaii: IEEE Signal Processing Society, 2011. p. 1-4. ISBN: 978-1-4673-0366-8.
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Povey Daniel
Ghoshal Arnab
Boulianne Gilles
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., FIT (FIT), UPGM (FIT)
Goel Nagendra
Hannemann Mirko, Ph.D., FIT (FIT), UPGM (FIT)
Motlíček Petr, doc. Ing., Ph.D., UPGM (FIT)
Qian Yanmin
Schwarz Petr, Ing., Ph.D., UPGM (FIT)
Silovský Jan
Stemmer Georg
Veselý Karel, Ing., Ph.D., FIT (FIT), UPGM (FIT)
Abstrakt

We described the design of Kaldi, a free and open-sourcespeech recognition toolkit. The toolkit currently supports modellingof context-dependent phones of arbitrary context lengths,and all commonly used techniques that can be estimated usingmaximum likelihood. It also supports the recently proposedSGMMs. Development of Kaldi is continuing and we areworking on using large language models in the FST framework,lattice generation and discriminative training.

Klíčová slova

speech recognition, toolkit

URL
Rok
2011
Strany
1–4
Sborník
Proceedings of ASRU 2011
Konference
IEEE 2011 Workshop on Automatic Speech Recognition and Understanding
ISBN
978-1-4673-0366-8
Vydavatel
IEEE Signal Processing Society
Místo
Hilton Waikoloa Village Resort, Hawaii
BibTeX
@inproceedings{BUT127200,
  author="Daniel {Povey} and Arnab {Ghoshal} and Gilles {Boulianne} and Lukáš {Burget} and Ondřej {Glembek} and Nagendra {Goel} and Mirko {Hannemann} and Petr {Motlíček} and Yanmin {Qian} and Petr {Schwarz} and Jan {Silovský} and Georg {Stemmer} and Karel {Veselý}",
  title="The Kaldi Speech Recognition Toolkit",
  booktitle="Proceedings of ASRU 2011",
  year="2011",
  pages="1--4",
  publisher="IEEE Signal Processing Society",
  address="Hilton Waikoloa Village Resort, Hawaii",
  isbn="978-1-4673-0366-8",
  url="http://www.fit.vutbr.cz/research/groups/speech/publi/2011/povey_asru2011_Kaldi%20toolkit.pdf"
}
Projekty
Multiligvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky, MPO, TIP, FR-TI1/034, zahájení: 2009-09-01, ukončení: 2013-08-31, ukončen
Technologie zpracování řeči pro efektivní komunikaci člověk-počítač, TAČR, Program aplikovaného výzkumu a experimentálního vývoje ALFA, TA01011328, zahájení: 2011-01-01, ukončení: 2014-12-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru