Detail publikace
Dereverberation and Beamforming in Robust Far-Field Speaker Recognition
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Tento článek se zabývá robustním ověřováním mluvčích (SV) při snímání ve vzdáleném poli. Robustnost je ověřena na podmnožině korpusu NIST SRE 2010, která je přenášena ve více reálných místnostech s různou akustikou a je zachycena několika mikrofony. Experimentovali jsme s různými kroky předzpracování dat, včetně různých přístupů k dereverberaci a formování paprsku aplikovaných na mikrofonní pole ad-hoc. Zjistili jsme, že významného zlepšení přesnosti lze dosáhnout pomocí generovaného vlastního tvaru paprsků založeného na neuronových sítích, kterému předchází vážená odchylka predikční chyby. Rovněž jsme prozkoumali účinek rozšíření dat přidáním různých skutečných nebo simulovaných akustických vlastností místnosti do tréninkové datové sady Pravděpodobnostní lineární diskriminační analýzy (PLDA). Ve výsledku jsme vyvinuli systém rozpoznávání mluvčích, jehož výkon je stabilní v různých akustických podmínkách místnosti. Poskytuje 41,4% relativního zlepšení výkonu v systému bez vícekanálového zpracování testovaného na nejčistších datech mikrofonu. S nejlepší kombinací předzpracování a augmentace dat jsme získali výkon blízký tomu, kterého jsme dosáhli s původními čistými daty testu.
@INPROCEEDINGS{FITPUB11843, author = "Ladislav Mo\v{s}ner and Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Ond\v{r}ej Novotn\'{y} and Jan \v{C}ernock\'{y}", title = "Dereverberation and Beamforming in Robust Far-Field Speaker Recognition", pages = "1334--1338", booktitle = "Proceedings of Interspeech 2018", journal = "Proceedings of Interspeech - on-line", volume = 2018, number = 9, year = 2018, location = "Hyderabad, IN", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2018-2306", language = "english", url = "https://www.fit.vut.cz/research/publication/11843" }