Detail výsledku

Improving Language Models for ASR Using Translated In-domain Data

KOMBRINK, S.; MIKOLOV, T.; KARAFIÁT, M.; BURGET, L. Improving Language Models for ASR Using Translated In-domain Data. Proceedings of 2012 IEEE International Conference on Acoustics, Speech and Signal Processing. Kyoto: IEEE Signal Processing Society, 2012. p. 4405-4408. ISBN: 978-1-4673-0044-5.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Kombrink Stefan, Dipl.-Linguist., FIT (FIT), UPGM (FIT)
Mikolov Tomáš, Ing., Ph.D., FIT (FIT), UPGM (FIT)
Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Abstrakt

This paper descibes how to do the acquisition of in-domain training data for the puspose of building speech recognition systems for under-resourced languages.

Klíčová slova

Low Resource ASR, Language Modeling,Machine Translation

URL
Rok
2012
Strany
4405–4408
Sborník
Proceedings of 2012 IEEE International Conference on Acoustics, Speech and Signal Processing
Konference
The 37th International Conference on Acoustics, Speech, and Signal Processing
ISBN
978-1-4673-0044-5
Vydavatel
IEEE Signal Processing Society
Místo
Kyoto
DOI
BibTeX
@inproceedings{BUT91478,
  author="Stefan {Kombrink} and Tomáš {Mikolov} and Martin {Karafiát} and Lukáš {Burget}",
  title="Improving Language Models for ASR Using Translated In-domain Data",
  booktitle="Proceedings of 2012 IEEE International Conference on Acoustics, Speech and Signal Processing",
  year="2012",
  pages="4405--4408",
  publisher="IEEE Signal Processing Society",
  address="Kyoto",
  doi="10.1109/ICASSP.2012.6288896",
  isbn="978-1-4673-0044-5",
  url="http://www.fit.vutbr.cz/research/groups/speech/publi/2012/kombrink_icassp2012_0004405.pdf"
}
Projekty
Multiligvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky, MPO, TIP, FR-TI1/034, zahájení: 2009-09-01, ukončení: 2013-08-31, ukončen
Rozpoznávání řeči pro jazyky s omezeným množstvím trénovacích zdrojů, GAČR, Postdoktorandské granty, GPP202/12/P604, zahájení: 2012-01-01, ukončení: 2014-12-31, ukončen
Technologie zpracování řeči pro efektivní komunikaci člověk-počítač, TAČR, Program aplikovaného výzkumu a experimentálního vývoje ALFA, TA01011328, zahájení: 2011-01-01, ukončení: 2014-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkumné skupiny
Pracoviště
Nahoru