Detail publikace

Dereverberation and Beamforming in Robust Far-Field Speaker Recognition

MOŠNER Ladislav, PLCHOT Oldřich, MATĚJKA Pavel, NOVOTNÝ Ondřej a ČERNOCKÝ Jan. Dereverberation and Beamforming in Robust Far-Field Speaker Recognition. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 1334-1338. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/Interspeech_2018/abstracts/2306.html
Název česky
Dereverberace a směrování paprsku v robustním rozpoznávání mluvčího ze vzdálených mikrofonů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

Tento článek se zabývá robustním ověřováním mluvčích (SV) při snímání ve vzdáleném poli. Robustnost je ověřena na podmnožině korpusu NIST SRE 2010, která je přenášena ve více reálných místnostech s různou akustikou a je zachycena několika mikrofony. Experimentovali jsme s různými kroky předzpracování dat, včetně různých přístupů k dereverberaci a formování paprsku aplikovaných na mikrofonní pole ad-hoc. Zjistili jsme, že významného zlepšení přesnosti lze dosáhnout pomocí generovaného vlastního tvaru paprsků založeného na neuronových sítích, kterému předchází vážená odchylka predikční chyby. Rovněž jsme prozkoumali účinek rozšíření dat přidáním různých skutečných nebo simulovaných akustických vlastností místnosti do tréninkové datové sady Pravděpodobnostní lineární diskriminační analýzy (PLDA). Ve výsledku jsme vyvinuli systém rozpoznávání mluvčích, jehož výkon je stabilní v různých akustických podmínkách místnosti. Poskytuje 41,4% relativního zlepšení výkonu v systému bez vícekanálového zpracování testovaného na nejčistších datech mikrofonu. S nejlepší kombinací předzpracování a augmentace dat jsme získali výkon blízký tomu, kterého jsme dosáhli s původními čistými daty testu.

Rok
2018
Strany
1334-1338
Časopis
Proceedings of Interspeech - on-line, roč. 2018, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2018
Konference
Interspeech Conference, Hyderabad, India, IN
Vydavatel
International Speech Communication Association
Místo
Hyderabad, IN
DOI
UT WoS
000465363900279
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11843,
  author = "Ladislav Mo\v{s}ner and Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Ond\v{r}ej Novotn\'{y} and Jan \v{C}ernock\'{y}",
  title = "Dereverberation and Beamforming in Robust Far-Field Speaker Recognition",
  pages = "1334--1338",
  booktitle = "Proceedings of Interspeech 2018",
  journal = "Proceedings of Interspeech - on-line",
  volume = 2018,
  number = 9,
  year = 2018,
  location = "Hyderabad, IN",
  publisher = "International Speech Communication Association",
  ISSN = "1990-9772",
  doi = "10.21437/Interspeech.2018-2306",
  language = "english",
  url = "https://www.fit.vut.cz/research/publication/11843"
}
Nahoru