Detail publikace
BAT System Description for NIST LRE 2015
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Fér Radek, Ing. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Pešán Jan, Ing. (UPGM FIT VUT)
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Grézl František, Ing., Ph.D. (UPGM FIT VUT)
Kesiraju Santosh (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Brummer Johan Nikolaas Langenhoven (Agnitio)
Swart Albert du Preez (Agnitio)
Cumani Sandro (POLITO)
Mallidi Sri Harish (AmazonCom)
Li Ruizhi (JHU)
V tomto příspěvku shrnujeme naše úsilí v rámci hodnocení NIST Language Recognition (LRE) 2015, které vyústilo ve velmi výkonné systémy. Poskytujeme oba popisy a analýzu systémů, které jsme zahrnuty v našem podání. Začneme podrobným popisem datových sad, které jsme použili pro trénink a vývoj, a následujeme popisem modelů a metod, které byly použity k vytvoření konečných skóre. Patří mezi ně front-end (tj. Detekce hlasové aktivity a extrakce funkcí), back-end (tj. Konečný klasifikátor) a fáze kalibrace a fúze. Kromě technik běžně používaných v terénu (jako jsou i-vektory, funkce DNN bottle-Neck, NN klasifikátory, Gaussian back-endy atd.), Představujeme méně běžné metody, jako je Sequence Summarizing Neural Networks (SSNN) a automatické zjišťování jednotek. Představujeme výkon systémů jak ve stavu Fixed (kde se od účastníků vyžaduje použití pouze předdefinovaných datových sad), tak ve stavu Open (kde mají účastníci povoleno používat jakýkoli veřejně dostupný zdroj) NIST LRE 2015.
@INPROCEEDINGS{FITPUB11221, author = "Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Radek F\'{e}r and Ond\v{r}ej Glembek and Ond\v{r}ej Novotn\'{y} and Jan Pe\v{s}\'{a}n and Karel Vesel\'{y} and Francois Antoine Lucas Yang Ondel and Martin Karafi\'{a}t and Franti\v{s}ek Gr\'{e}zl and Santosh Kesiraju and Luk\'{a}\v{s} Burget and Langenhoven Nikolaas Johan Brummer and Preez du Albert Swart and Sandro Cumani and Harish Sri Mallidi and Ruizhi Li", title = "BAT System Description for NIST LRE 2015", pages = "166--173", booktitle = "Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop", journal = "Proceedings of Odyssey: The Speaker and Language Recognition Workshop", volume = 2016, number = 06, year = 2016, location = "Bilbao, ES", publisher = "International Speech Communication Association", ISSN = "2312-2846", doi = "10.21437/Odyssey.2016-24", language = "english", url = "https://www.fit.vut.cz/research/publication/11221" }