Detail publikace

BAT System Description for NIST LRE 2015

PLCHOT Oldřich, MATĚJKA Pavel, FÉR Radek, GLEMBEK Ondřej, NOVOTNÝ Ondřej, PEŠÁN Jan, VESELÝ Karel, ONDEL Yang Lucas Antoine Francois, KARAFIÁT Martin, GRÉZL František, KESIRAJU Santosh, BURGET Lukáš, BRUMMER Johan Nikolaas Langenhoven, SWART Albert du Preez, CUMANI Sandro, MALLIDI Sri Harish a LI Ruizhi. BAT System Description for NIST LRE 2015. In: Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop. Bilbao: International Speech Communication Association, 2016, s. 166-173. ISSN 2312-2846. Dostupné z: http://www.odyssey2016.org/papers/pdfs_stamped/73.pdf
Název česky
Popis BAT systému pro NIST LRE 2015 evaluace
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Fér Radek, Ing. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Pešán Jan, Ing. (UPGM FIT VUT)
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Grézl František, Ing., Ph.D. (UPGM FIT VUT)
Kesiraju Santosh (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Brummer Johan Nikolaas Langenhoven (Agnitio)
Swart Albert du Preez (Agnitio)
Cumani Sandro (POLITO)
Mallidi Sri Harish (AmazonCom)
Li Ruizhi (JHU)
URL
Abstrakt

V tomto příspěvku shrnujeme naše úsilí v rámci hodnocení NIST Language Recognition (LRE) 2015, které vyústilo ve velmi výkonné systémy. Poskytujeme oba popisy a analýzu systémů, které jsme zahrnuty v našem podání. Začneme podrobným popisem datových sad, které jsme použili pro trénink a vývoj, a následujeme popisem modelů a metod, které byly použity k vytvoření konečných skóre. Patří mezi ně front-end (tj. Detekce hlasové aktivity a extrakce funkcí), back-end (tj. Konečný klasifikátor) a fáze kalibrace a fúze. Kromě technik běžně používaných v terénu (jako jsou i-vektory, funkce DNN bottle-Neck, NN klasifikátory, Gaussian back-endy atd.), Představujeme méně běžné metody, jako je Sequence Summarizing Neural Networks (SSNN) a automatické zjišťování jednotek. Představujeme výkon systémů jak ve stavu Fixed (kde se od účastníků vyžaduje použití pouze předdefinovaných datových sad), tak ve stavu Open (kde mají účastníci povoleno používat jakýkoli veřejně dostupný zdroj) NIST LRE 2015.

Rok
2016
Strany
166-173
Časopis
Proceedings of Odyssey: The Speaker and Language Recognition Workshop, roč. 2016, č. 6, ISSN 2312-2846
Sborník
Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop
Konference
Odyssey 2016, Bilbao, ES
Vydavatel
International Speech Communication Association
Místo
Bilbao, ES
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11221,
  author = "Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Radek F\'{e}r and Ond\v{r}ej Glembek and Ond\v{r}ej Novotn\'{y} and Jan Pe\v{s}\'{a}n and Karel Vesel\'{y} and Francois Antoine Lucas Yang Ondel and Martin Karafi\'{a}t and Franti\v{s}ek Gr\'{e}zl and Santosh Kesiraju and Luk\'{a}\v{s} Burget and Langenhoven Nikolaas Johan Brummer and Preez du Albert Swart and Sandro Cumani and Harish Sri Mallidi and Ruizhi Li",
  title = "BAT System Description for NIST LRE 2015",
  pages = "166--173",
  booktitle = "Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop",
  journal = "Proceedings of Odyssey: The Speaker and Language Recognition Workshop",
  volume = 2016,
  number = 06,
  year = 2016,
  location = "Bilbao, ES",
  publisher = "International Speech Communication Association",
  ISSN = "2312-2846",
  doi = "10.21437/Odyssey.2016-24",
  language = "english",
  url = "https://www.fit.vut.cz/research/publication/11221"
}
Nahoru