Detail publikace

Compact Network for Speakerbeam Target Speaker Extraction

DELCROIX Marc, ŽMOLÍKOVÁ Kateřina, OCHIAI Tsubasa, KINOSHITA Keisuke, ARAKI Shoko a NAKATANI Tomohiro. Compact Network for Speakerbeam Target Speaker Extraction. In: Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019, s. 6965-6969. ISBN 978-1-5386-4658-8. Dostupné z: https://ieeexplore.ieee.org/document/8683087
Název česky
Kompaktní síť pro SpeakerBeam extrakci mluvčího
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Delcroix Marc (NTT)
Žmolíková Kateřina, Ing., Ph.D. (UPGM FIT VUT)
Ochiai Tsubasa (NTT)
Kinoshita Keisuke (NTT)
Araki Shoko (NTT)
Nakatani Tomohiro (NTT)
URL
Abstrakt

V tomto článku navrhujeme jednoduše škálovat aktivace skryté vrstvy sítě pro extrakci řeči s váhami odvozenými od pomocných funkcí. Tento jednodušší přístup výrazně snižuje počet parametrů modelu až o 60%, což je mnohem praktičtější při zachování podobné úrovně výkonu. Náš přístup jsme testovali na simulovaných a reálných hlučných a dozvukových směsích a ukázali jsme potenciál SpeakerBeam pro aplikace v reálném životě. Navíc jsme ukázali, že výkon SpeakerBeam pro extrakci řeči je srovnatelný s výkonem nejmodernější metody separace řeči s podobnou konfigurací sítě.

Rok
2019
Strany
6965-6969
Sborník
Proceedings of ICASSP
Konference
2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), Brighton, GB
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton, GB
DOI
UT WoS
000482554007040
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12096,
   author = "Marc Delcroix and Kate\v{r}ina \v{Z}mol\'{i}kov\'{a} and Tsubasa Ochiai and Keisuke Kinoshita and Shoko Araki and Tomohiro Nakatani",
   title = "Compact Network for Speakerbeam Target Speaker Extraction",
   pages = "6965--6969",
   booktitle = "Proceedings of ICASSP",
   year = 2019,
   location = "Brighton, GB",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-5386-4658-8",
   doi = "10.1109/ICASSP.2019.8683087",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12096"
}
Nahoru