Detail publikace

Detecting English Speech in the Air Traffic Control Voice Communication

SZŐKE Igor, KESIRAJU Santosh, NOVOTNÝ Ondřej, KOCOUR Martin, VESELÝ Karel a ČERNOCKÝ Jan. Detecting English Speech in the Air Traffic Control Voice Communication. In: Proceedings Interspeech 2021. Brno: International Speech Communication Association, 2021, s. 3286-3290. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/interspeech_2021/szoke21_interspeech.html
Název česky
Detekce anglických promluv v hlasové komunikaci letecké dopravy
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT)
Kesiraju Santosh (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Kocour Martin, Ing. (UPGM FIT VUT)
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
URL
Abstrakt

Vývoj aplikací s podporou hlasu v kokpitu vyžaduje skutečné datové sady s popisky a anotacemi. Založili jsme komunitní platformu pro shromažďování řeči z řízení letového provozu (ATC), celosvětově v projektu ATCO2. Filtrování ne anglické řeči je jednou z hlavních složek při zpracování datových kanálů. Navrhovaný systín detekce anglického jazyka (ELD) je založen na embeddingech z bayesovského podprostoru multinomického modelu. Trénuje se na síti zmatení slov z ASR systému. Je robustní, snadno se trénuje a je lehký. Dosáhli jsme 0:0439 stejné míry chyb (EER), 50% relativní snížení ve srovnání s aktuálním stavem v oboru, akustický systém ELD založený na x-vektorech ve scénáři v doméně. Dále jsme dosáhli EER 0:1352, 33% relativní snížení ve srovnání s akustickým ELD v neviditelném jazyce stav (mimo doménu). Hodnocení plánujeme zveřejnit datový soubor z projektu ATCO2.

Rok
2021
Strany
3286-3290
Časopis
Proceedings of Interspeech - on-line, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings Interspeech 2021
Konference
Interspeech Conference, Brno, CZ
Vydavatel
International Speech Communication Association
Místo
Brno, CZ
DOI
UT WoS
000841879503076
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12609,
   author = "Igor Sz\H{o}ke and Santosh Kesiraju and Ond\v{r}ej Novotn\'{y} and Martin Kocour and Karel Vesel\'{y} and Jan \v{C}ernock\'{y}",
   title = "Detecting English Speech in the Air Traffic Control Voice Communication",
   pages = "3286--3290",
   booktitle = "Proceedings Interspeech 2021",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2021,
   number = 8,
   year = 2021,
   location = "Brno, CZ",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2021-1033",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12609"
}
Nahoru