Detail výsledku

Evaluation of SpeakerBeam target speech extraction in real noisy and reverberant conditions

DELCROIX, M.; ŽMOLÍKOVÁ, K.; OCHIAI, T.; KINOSHITA, K.; ARAKI, S.; NAKATANI, T. Evaluation of SpeakerBeam target speech extraction in real noisy and reverberant conditions. THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN, 2019, vol. 2019, no. 2, p. 1-2. ISSN: 0369-4232.
Typ
článek v časopise
Jazyk
anglicky
Autoři
Delcroix Marc, FIT (FIT)
Žmolíková Kateřina, Ing., Ph.D., UPGM (FIT)
OCHIAI, T.
Kinoshita Keisuke, FIT (FIT)
ARAKI, S.
Nakatani Tomohiro, FIT (FIT)
Abstrakt

The paper discusses SpeakerBeam for target speaker extraction. The main variation is in the use of a scaling adaptation layer to adapt a neural network instead of the previously proposed factorized layer. This enables to greatly reduce the number of model parameters, without affecting performance.

Klíčová slova

SpeakerBeam, speaker, extraction, neural network

URL
Rok
2019
Strany
1–2
Časopis
THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN, roč. 2019, č. 2, ISSN 0369-4232
BibTeX
@article{BUT160008,
  author="DELCROIX, M. and ŽMOLÍKOVÁ, K. and OCHIAI, T. and KINOSHITA, K. and ARAKI, S. and NAKATANI, T.",
  title="Evaluation of SpeakerBeam target speech extraction in real noisy and reverberant conditions",
  journal="THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN",
  year="2019",
  volume="2019",
  number="2",
  pages="1--2",
  issn="0369-4232",
  url="https://www.fit.vut.cz/research/publication/12103/"
}
Soubory
Projekty
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
NTT - Parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat, NTT, zahájení: 2019-01-01, ukončení: 2019-12-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru