Detail výsledku

iVector-Based Discriminative Adaptation for Automatic Speech Recognition

KARAFIÁT, M.; BURGET, L.; MATĚJKA, P.; GLEMBEK, O.; ČERNOCKÝ, J. iVector-Based Discriminative Adaptation for Automatic Speech Recognition. Proceedings of ASRU 2011. Hilton Waikoloa Village, Big Island, Hawaii: IEEE Signal Processing Society, 2011. p. 152-157. ISBN: 978-1-4673-0366-8.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Abstrakt

The iVector is alow-dimensional fixed-length representation of information about speaker and acoustic environment. Toutilize iVectors for adaptation, region dependent linear transforms(RDLT) are discriminatively trained using the MPE criterion on largeamounts of annotated data to extract the relevant information fromiVectors and to compensate speech features. The approach was tested onstandard CTS data. We found it to be complementary to common adaptationtechniques. On a well-tuned RDLT system with standard CMLLR adaptationwe reached an 0.8% additive absolute WER improvement.

Klíčová slova

Automatic speech recognition, I-vector, Discriminative adaptation

URL
Rok
2011
Strany
152–157
Sborník
Proceedings of ASRU 2011
Konference
IEEE 2011 Workshop on Automatic Speech Recognition and Understanding
ISBN
978-1-4673-0366-8
Vydavatel
IEEE Signal Processing Society
Místo
Hilton Waikoloa Village, Big Island, Hawaii
BibTeX
@inproceedings{BUT76442,
  author="Martin {Karafiát} and Lukáš {Burget} and Pavel {Matějka} and Ondřej {Glembek} and Jan {Černocký}",
  title="iVector-Based Discriminative Adaptation for Automatic Speech Recognition",
  booktitle="Proceedings of ASRU 2011",
  year="2011",
  pages="152--157",
  publisher="IEEE Signal Processing Society",
  address="Hilton Waikoloa Village, Big Island, Hawaii",
  isbn="978-1-4673-0366-8",
  url="http://www.fit.vutbr.cz/research/groups/speech/publi/2011/karafiat_asru2011_00152.pdf"
}
Projekty
Multiligvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky, MPO, TIP, FR-TI1/034, zahájení: 2009-09-01, ukončení: 2013-08-31, ukončen
Rozpoznávání mluvené řeči v reálných podmínkách, GAČR, Standardní projekty, GA102/08/0707, zahájení: 2008-01-01, ukončení: 2011-12-31, ukončen
Technologie zpracování řeči pro efektivní komunikaci člověk-počítač, TAČR, Program aplikovaného výzkumu a experimentálního vývoje ALFA, TA01011328, zahájení: 2011-01-01, ukončení: 2014-12-31, ukončen
Výzkum informačních technologií z hlediska bezpečnosti, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, zahájení: 2007-01-01, ukončení: 2013-12-31, řešení
Výzkumné skupiny
Pracoviště
Nahoru