Detail projektu
Speech enhancement front-end for robust automatic speech recognition with large amount of training data
Období řešení: 2. 1. 2023 - 31. 1. 2024
Typ projektu: smluvní výzkum
Objednatel: NTT Corporation
Název česky
Parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat
Typ
smluvní výzkum
Klíčová slova
rozpoznávání řeči, diarizace mluvčího, velký objem dat, robustnost
Abstrakt
Společný výzkum se zaměří na zkoumání a vývoj technik vylepšování řeči a diarizace mluvčího pro systémy automatického rozpoznávání řeči, které jsou trénovány pomocí velkého množství tréninkových dat.
Řešitelé
Diez Sánchez Mireia, M.Sc., Ph.D.
(UPGM FIT VUT)
, hlavní řešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Pavlus Ján, Ing. (UPGM FIT VUT)
Peng Junyi, Msc. Eng. (UPGM FIT VUT)
Švec Ján, Ing. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Pavlus Ján, Ing. (UPGM FIT VUT)
Peng Junyi, Msc. Eng. (UPGM FIT VUT)
Švec Ján, Ing. (UPGM FIT VUT)
Publikace
2023
- DELCROIX Marc, TAWARA Naohiro, DIEZ Sánchez Mireia, LANDINI Federico Nicolás, SILNOVA Anna, OGAWA Atsunori, NAKATANI Tomohiro, BURGET Lukáš a ARAKI Shoko. Multi-Stream Extension of Variational Bayesian HMM Clustering (MS-VBx) for Combined End-to-End and Vector Clustering-based Diarization. In: Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Dublin: International Speech Communication Association, 2023, s. 3477-3481. ISSN 1990-9772. Detail