Fakulta informačních technologií VUT v Brně

Detail publikace

Learning Speaker Representation for Neural Network Based Multichannel Speaker Extraction

ŽMOLÍKOVÁ Kateřina, DELCROIX Marc, KINOSHITA Keisuke, HIGUCHI Takuya, OGAWA Atsunori a NAKATANI Tomohiro. Learning Speaker Representation for Neural Network Based Multichannel Speaker Extraction. In: Proceedings of ASRU 2017. Okinawa: IEEE Signal Processing Society, 2017, s. 8-15. ISBN 978-1-5090-4788-8.
Název česky
Učení reprezentací řečníků pro vícekanálovou extrakci jednoho řečníka založenou na neuronových sítích
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Žmolíková Kateřina, Ing. (UPGM FIT VUT)
Delcroix Marc (NTT)
Kinoshita Keisuke (NTT)
Higuchi Takuya (NTT)
Ogawa Atsunori (NTT)
Nakatani Tomohiro (NTT)
URL
Abstrakt
Tento článek pojednává o učení reprezentací řečníků pro vícekanálovou extrakci jednoho řečníka založenou na neuronových sítích,
Rok
2017
Strany
8-15
Sborník
Proceedings of ASRU 2017
Konference
2017 IEEE Automatic Speech Recognition and Understanding Workshop, Okinawa, JP
ISBN
978-1-5090-4788-8
Vydavatel
IEEE Signal Processing Society
Místo
Okinawa, JP
DOI
BibTeX
@INPROCEEDINGS{FITPUB11596,
   author = "Kate\v{r}ina \v{Z}mol\'{i}kov\'{a} and Marc Delcroix and Keisuke Kinoshita and Takuya Higuchi and Atsunori Ogawa and Tomohiro Nakatani",
   title = "Learning Speaker Representation for Neural Network Based Multichannel Speaker Extraction",
   pages = "8--15",
   booktitle = "Proceedings of ASRU 2017",
   year = 2017,
   location = "Okinawa, JP",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-5090-4788-8",
   doi = "10.1109/ASRU.2017.8268910",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11596"
}
Nahoru