Detail publikace
BUT/Phonexia Bottleneck Feature Extractor
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Grézl František, Ing., Ph.D. (UPGM FIT VUT)
Schwarz Petr, Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Tento dokument doplňuje veřejné vydání extraktoru funkcí úzkého místa BUT / Phonexia (BN). Počínaje krátkou historií přístupů k extrakci řečových funkcí založených na neuronových sítích (NN) a přístupech založených na BN popisuje strukturu vydaného softwaru. Z toho vyplývá popis tří poskytovaných NN: první dva vyškoleni v americkém anglickém korpusu Fisher s cíli monofonního a vázaného stavu a třetí síť trénována vícejazyčným způsobem v 17 jazycích Babel. NN byli technicky vyškoleni pro klasifikaci akustických jednotek, avšak sítě byly optimalizovány s ohledem na úlohu rozpoznávání jazyků, která je hlavním zaměřením tohoto příspěvku. Přesto stojí za zmínku, že kromě rozpoznávání jazyků lze poskytnutý software použít pro jakýkoli úkol související s řečí. Příspěvek končí komplexním shrnutím výsledků získaných při plnění úkolů NIST 2015 a 2017 Language Recognition Evaluation.
@INPROCEEDINGS{FITPUB11789, author = "Anna Silnova and Pavel Mat\v{e}jka and Ond\v{r}ej Glembek and Old\v{r}ich Plchot and Ond\v{r}ej Novotn\'{y} and Franti\v{s}ek Gr\'{e}zl and Petr Schwarz and Jan \v{C}ernock\'{y}", title = "BUT/Phonexia Bottleneck Feature Extractor", pages = "283--287", booktitle = "Proceedings of Odyssey 2018", journal = "Proceedings of Odyssey: The Speaker and Language Recognition Workshop", volume = 2018, number = 6, year = 2018, location = "Les Sables dOlonne, FR", publisher = "International Speech Communication Association", ISSN = "2312-2846", doi = "10.21437/Odyssey.2018-40", language = "english", url = "https://www.fit.vut.cz/research/publication/11789" }