Detail publikace

Measuring Speech Recognition And Understanding Performance in Air Traffic Control Domain Beyond Word Error Rates

HELMKE Hartmut, SHETTY Shruthi, KLEINERT Matthias, OHNEISER Oliver, EHR Heiko, MOTLÍČEK Petr, PRASAD Amrutha a WINDISCH Christian a kol. Measuring Speech Recognition And Understanding Performance in Air Traffic Control Domain Beyond Word Error Rates. In: Proceedings of 11th SESAR Innovation Days 2021. Belgie, 2021, s. 1-8.
Název česky
Měření přesnosti rozpoznávání a porozumění řeči pro oblast řízení letového provozu překonávající slovní chybovost
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Helmke Hartmut (DLR)
Shetty Shruthi (DLR)
Kleinert Matthias (DLR)
Ohneiser Oliver (DLR)
Ehr Heiko (DLR)
Motlíček Petr, Ing., Ph.D. (IDIAP)
Prasad Amrutha (IDIAP)
a další
URL
Klíčová slova

chybovost slov, rychlost rozpoznávání příkazů, jazyk porozumění, řízení letového provozu, ATC, nezařazená slovní sazba

Abstrakt

Aplikace automatického rozpoznávání řeči (ASR) v oblasti analogové hlasové komunikace mezi řídícími letového provozu (ATCo) a piloty má pro koncové uživatele více požadavků, než jen transformaci mluveného slova do textu. Je k ničemu například pro podporu detekce chyb zpětného čtení, pokud je rozpoznání slov dokonalé, pokud je sémantická interpretace chybná. Pro ATCo není téměř důležité, zda jsou slova pozdravu správně rozpoznána. Špatné rozpoznání pozdravu by však nemělo narušit správné rozpoznání, např. příkazu sestup. Důležitější je správná sémantická interpretace. Jaká je však správná sémantická interpretace, zvláště když se ATCos nebo pilot více či méně odchylují od publikované standardní frazeologie? Pro porovnávání výkonu různých aplikací rozpoznávání řeči se 14 evropských partnerů z oblasti řízení letového provozu (ATM) nedávno dohodlo na společném souboru pravidel, tj. na ontologii, jak anotovat řečové projevy ATCo na sémantické úrovni. Tento dokument nejprve představuje novou metriku neklasifikované rychlosti slov, rozšiřuje ontologii na pilotní výroky a zavádí metriky míry rozpoznání příkazů, chybovosti rozpoznání příkazů a míry odmítnutí rozpoznání příkazů. To umožňuje srovnání různých případů rozpoznávání řeči a porozumění na sémantické úrovni. Implementace použitá v tomto dokumentu dosahuje míry rozpoznání příkazů lepší než 96 % pro Prague Approach, i když je četnost slovních chyb vyšší než 2,5 % na základě více než 12 000 příkazů ATCo zaznamenaných v provozním i laboratorním prostředí. To překonalo předchozí zveřejněné sazby o 2 % absolutně.

Rok
2021
Strany
1-8
Sborník
Proceedings of 11th SESAR Innovation Days 2021
Konference
11th SESAR Innovation Days, virtuální akce pořádáná SESAR Joint Undertaking, BE
Místo
Belgie, BE
BibTeX
@INPROCEEDINGS{FITPUB12684,
   author = "Hartmut Helmke and Shruthi Shetty and Matthias Kleinert and Oliver Ohneiser and Heiko Ehr and Petr Motl\'{i}\v{c}ek and Amrutha Prasad and Christian Windisch and et al.",
   title = "Measuring Speech Recognition And Understanding Performance in Air Traffic Control Domain Beyond Word Error Rates",
   pages = "1--8",
   booktitle = "Proceedings of 11th SESAR Innovation Days 2021",
   year = 2021,
   location = "Belgie, BE",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12684"
}
Nahoru