Detail publikace

Automatic Speech Analysis Framework for ATC Communication in HAAWAII

MOTLÍČEK Petr, PRASAD Amrutha, NIGMATULINA Iuliia, HELMKE Hartmut, OHNEISER Oliver a KLEINERT Matthias. Automatic Speech Analysis Framework for ATC Communication in HAAWAII. In: Proceedings of the 13th SESAR Innovation Days. Seville: SESAR Joint Undertaking, 2023, s. 1-9. Dostupné z: https://www.sesarju.eu/sites/default/files/documents/sid/2023/Papers/SIDs_2023_paper_72%20final.pdf
Název česky
Systém pro automatickou analýzu řeči pro letecké komunikace v projektu HAAWAII
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Motlíček Petr, doc. Ing., Ph.D. (UPGM FIT VUT)
Prasad Amrutha (UPGM FIT VUT)
Nigmatulina Iuliia (IDIAP)
Helmke Hartmut (DLR)
Ohneiser Oliver (DLR)
Kleinert Matthias (DLR)
URL
Abstrakt

V posledních letech několik SESAR financovalo ex- ploratorní projekty zaměřené na přiblížení řeči a jazyka technologie do oblasti řízení letového provozu (ATM) a demonstrovat svou přidanou hodnotu prostřednictvím úspěšných aplikací. Nedávno ukončený projekt HAAWAII vyvinul generický archiv tecture and framework, který byl ověřen několika úkoly, jako je zvýraznění volacích značek, předvyplnění radarových štítků a detekce chyb zpětného čtení. Primárním cílem bylo podpořit pilota a komunikaci řídícího letového provozu nasazením automatiky Motory pro rozpoznávání řeči (ASR). Kontextové informace (pokud dostupné) extrahované z přehledových údajů, údajů letového plánu, popř předchozí komunikaci lze využít prostřednictvím podpory entity k dalšímu zlepšení výkonu rozpoznávání. HAWAII navrhl různé konstrukční atributy pro integraci motoru ASR do rámce ATM, často v závislosti na konkrétní technické specifika cílových poskytovatelů letových navigačních služeb (ANSP). Tento práce podává stručný přehled a poskytuje objektivní hodnocení komponent pro zpracování řeči vyvinutých a integrovaných rámec HAAWAII. Konkrétně se jedná o následující úkoly hodnoceno w.r.t. aplikační doména: (i) detekce řečové aktivity, (ii) segmentace mluvčích a klasifikace rolí mluvčích jako (iii) ASR. Podle našich nejlepších znalostí nabízí rámec HAAWAII nejvýkonnější řečové technologie pro ATM, dosahující výše přesnost rozpoznávání (tj. oprava chyb prováděná využitím další kontextová data), robustnost (tj. vyvinuté modely pomocí velkých tréninkových korpusů) a podporou rychlé domény převod (tj. do nového sektoru ATM s minimální investicí). Dva scénáře poskytnuté poskytovateli letových navigačních služeb byly použity pro testování, dosažení přesnost detekce volacích značek asi 96 % a 95 % pro NATS a ISAVIA, resp.

Rok
2023
Strany
1-9
Sborník
Proceedings of the 13th SESAR Innovation Days
Konference
13th SESAR Innovation Days, Seville, ES
Vydavatel
SESAR Joint Undertaking
Místo
Seville, ES
BibTeX
@INPROCEEDINGS{FITPUB13161,
   author = "Petr Motl\'{i}\v{c}ek and Amrutha Prasad and Iuliia Nigmatulina and Hartmut Helmke and Oliver Ohneiser and Matthias Kleinert",
   title = "Automatic Speech Analysis Framework for ATC Communication in HAAWAII",
   pages = "1--9",
   booktitle = "Proceedings of the 13th SESAR Innovation Days",
   year = 2023,
   location = "Seville, ES",
   publisher = "SESAR Joint Undertaking",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13161"
}
Nahoru