Detail publikace

Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings

YANG Jinyi, ONDEL Yang Lucas Antoine Francois, MANOHAR Vimal a HEŘMANSKÝ Hynek. Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings. In: Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019, s. 3747-3751. ISBN 978-1-5386-4658-8. Dostupné z: https://ieeexplore.ieee.org/document/8683722
Název česky
K automatickým metodám pro detekci chyb přepisů nahrávek řeči
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Yang Jinyi (JHU)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Manohar Vimal (JHU)
Heřmanský Hynek, prof. Ing., Dr.Eng. (JHU)
URL
Abstrakt

Tato práce zkoumá různé metody detekce chyb při přepisech záznamů řeči. Uměle jsme narušili dobře přepsané transkripce řeči třemi typy chyb: substituce, vložení a vymazání fonematických transkripcí TIMIT a transkripce slov WSJ. Nejprve použijeme Bayesovský model výběru metody porovnáním log-pravděpodobnosti z zarovnání a rozpoznávání telefonu, výsledné skóre se vypočítá pro rozhodnutí. V této metodě uvažujeme dva modely, Bayesovský skrytý Markovův model (HMM) a Variational Auto-Encoder (VAE) kombinovaný s HMM. Alternativně vytváříme zkreslený systém ASR s jazykovými modely vyškolenými na jednotlivé transkripce, rozhodnutí o detekci je založeno na vzdálenosti Levenshtein (LD) mezi transkripcí a věšteckou cestou od dekódované mřížky. Vyhodnocujeme metody detekce chyb v poškozené transkripci TIMIT, nejlepší výsledek (buď pomocí výběru modelu u modelu VAE nebo zkreslené ASR) dosahuje 7% stejnou chybovost na křivce Detection Error Tradeoff (DET); Vyhodnocujeme také metody detekce chyb v poškozených transkripcích WSJ a nejlepší výsledek (pomocí zkreslené ASR) dosahuje stejnou chybovost 3%.

Rok
2019
Strany
3747-3751
Sborník
Proceedings of ICASSP
Konference
2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), Brighton, GB
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton, GB
DOI
UT WoS
000482554003194
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12099,
   author = "Jinyi Yang and Francois Antoine Lucas Yang Ondel and Vimal Manohar and Hynek He\v{r}mansk\'{y}",
   title = "Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings",
   pages = "3747--3751",
   booktitle = "Proceedings of ICASSP",
   year = 2019,
   location = "Brighton, GB",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-5386-4658-8",
   doi = "10.1109/ICASSP.2019.8683722",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12099"
}
Nahoru