Detail publikace

BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020

LOZANO Díez Alicia, SILNOVA Anna, PULUGUNDLA Bhargav, ROHDIN Johan A., VESELÝ Karel, BURGET Lukáš, PLCHOT Oldřich, GLEMBEK Ondřej, NOVOTNÝ Ondřej a MATĚJKA Pavel. BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020. In: Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Shanghai: International Speech Communication Association, 2020, s. 761-765. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/Interspeech_2020/pdfs/2882.pdf
Název česky
Systém VUT pro ověřování mluvčího závislý na textu pro SdSV Challenge 2020
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

V tomto článku prezentujeme vítězné podání VUT v Brně do soutěže SdSV Challenge 2020, které se týkalo textově závislého úkolu. Vzhledem k velkému množství tréninkových dat dostupných v této výzvě jsme zkoumali úspěšné techniky z textově nezávislých systémů ve scénáři závislém na textu. Zejména jsme trénovali x-vektor extraktory na souborech dat v doméně i mimo doménu a kombinovali je s i-vektory trénovanými na zřetězených MFCC a bottleneckovými prvky, což se ukázalo být efektivním pro scénář závislý na textu. Navíc jsme navrhli použití frázově závislého backend PLDA pro skórování a jeho kombinaci s jednoduchým rozpoznávačem frází, která přináší až 63% relativní zlepšení našeho vývojového souboru s ohledem na používání standardního PLDA. Nakonec zkombinujeme náš různý i-vektor a systémy založené na x-vektorech pomocí jednoduché lineární logistické regrese fúze na úrovni skóre, která poskytuje 28% relativní zlepšení na hodnotící sadě s ohledem na náš nejlepší singl systém.

Rok
2020
Strany
761-765
Časopis
Proceedings of Interspeech - on-line, roč. 2020, č. 10, ISSN 1990-9772
Sborník
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Konference
Interspeech, Shanghai, CN
Vydavatel
International Speech Communication Association
Místo
Shanghai, CN
DOI
UT WoS
000833594100158
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12378,
  author = "Alicia D\'{i}ez Lozano and Anna Silnova and Bhargav Pulugundla and A. Johan Rohdin and Karel Vesel\'{y} and Luk\'{a}\v{s} Burget and Old\v{r}ich Plchot and Ond\v{r}ej Glembek and Ond\v{r}ej Novotn\'{y} and Pavel Mat\v{e}jka",
  title = "BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020",
  pages = "761--765",
  booktitle = "Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
  journal = "Proceedings of Interspeech - on-line",
  volume = 2020,
  number = 10,
  year = 2020,
  location = "Shanghai, CN",
  publisher = "International Speech Communication Association",
  ISSN = "1990-9772",
  doi = "10.21437/Interspeech.2020-2882",
  language = "english",
  url = "https://www.fit.vut.cz/research/publication/12378"
}
Nahoru