Detail projektu
Discriminative training of speaker-normalized models for automatic speech recognition
Období řešení: 7. 1. 2011 - 7. 1. 2013
Typ projektu: grant
Kód: SIGA890
Agentura: Jihomoravský kraj
Program: Sedmý rámcový program Evropského společenství pro výzkum, technologický rozvoj a demonstrace
Název česky
Diskriminativní trénování modelů normalizovaných na mluvčího pro automatické rozpoznávání řeči
Typ
grant
Klíčová slova
rozpoznávání řeči
Abstrakt
Projekt se zabývá automatickým rozpoznáváním řeči. Zaměřuje se na výzkum diskriminativního trénování modelů normalizovaných na mluvčího, které umožní vyvinout přesnější systémy pro rozpoznávání řeči s pokročilou adaptací na cílové uživatele. Zvláštní pozornost je věnována aplikaci diskriminativně trénovaným adaptacím na mluvčího v případě sub-space modelování řeči.
Řešitelé
Rath Shakti P.
(UPGM FIT VUT)
, hlavní řešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Publikace
2013
- RATH Shakti P., BURGET Lukáš, KARAFIÁT Martin, GLEMBEK Ondřej a ČERNOCKÝ Jan. A Region-specific Feature-space Transformation for Speaker Adaptation and Singularity Analysis of Jacobian Matrix. In: Proceedings of Interspeeech 2013. Lyon: International Speech Communication Association, 2013, s. 1228-1232. ISBN 978-1-62993-443-3. ISSN 2308-457X. Detail
- RATH Shakti P., POVEY Daniel, VESELÝ Karel a ČERNOCKÝ Jan. Improved Feature Processing for Deep Neural Networks. In: Proceedings of Interspeech 2013. Lyon: International Speech Communication Association, 2013, s. 109-113. ISBN 978-1-62993-443-3. ISSN 2308-457X. Detail
2012
- RATH Shakti P., KARAFIÁT Martin, GLEMBEK Ondřej a ČERNOCKÝ Jan. A factorized representation of FMLLR transform based on QR-decomposition. In: Proceedings of Interspeech 2012. Portland, Oregon: International Speech Communication Association, 2012, s. 1-4. ISBN 978-1-62276-759-5. ISSN 1990-9772. Detail