Fakulta informačních technologií VUT v Brně

Detail publikace

Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings

YANG Jinyi, ONDEL Lucas, MANOHAR Vimal a HEŘMANSKÝ Hynek. Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings. In: Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019, s. 3747-3751. ISBN 978-1-5386-4658-8. Dostupné z: https://ieeexplore.ieee.org/document/8683722
Název česky
K automatickým metodám pro detekci chyb přepisů nahrávek řeči
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Yang Jinyi (JHU)
Ondel Lucas, Mgr. (UPGM FIT VUT)
Manohar Vimal (JHU)
Heřmanský Hynek, prof. Ing., Dr.Eng. (JHU)
URL
Abstrakt
Tato práce zkoumá různé metody detekce chyb při přepisech záznamů řeči. Uměle jsme narušili dobře přepsané transkripce řeči třemi typy chyb: substituce, vložení a vymazání fonematických transkripcí TIMIT a transkripce slov WSJ. Nejprve použijeme Bayesovský model výběru metody porovnáním log-pravděpodobnosti z zarovnání a rozpoznávání telefonu, výsledné skóre se vypočítá pro rozhodnutí. V této metodě uvažujeme dva modely, Bayesovský skrytý Markovův model (HMM) a Variational Auto-Encoder (VAE) kombinovaný s HMM. Alternativně vytváříme zkreslený systém ASR s jazykovými modely vyškolenými na jednotlivé transkripce, rozhodnutí o detekci je založeno na vzdálenosti Levenshtein (LD) mezi transkripcí a věšteckou cestou od dekódované mřížky. Vyhodnocujeme metody detekce chyb v poškozené transkripci TIMIT, nejlepší výsledek (buď pomocí výběru modelu u modelu VAE nebo zkreslené ASR) dosahuje 7% stejnou chybovost na křivce Detection Error Tradeoff (DET); Vyhodnocujeme také metody detekce chyb v poškozených transkripcích WSJ a nejlepší výsledek (pomocí zkreslené ASR) dosahuje stejnou chybovost 3%.
Rok
2019
Strany
3747-3751
Sborník
Proceedings of ICASSP
Konference
International Conference on Acoustics, Speech, and Signal Processing, Brighton, GB
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton, GB
DOI
BibTeX
@INPROCEEDINGS{FITPUB12099,
   author = "Jinyi Yang and Lucas Ondel and Vimal Manohar and Hynek He\v{r}mansk\'{y}",
   title = "Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings",
   pages = "3747--3751",
   booktitle = "Proceedings of ICASSP",
   year = 2019,
   location = "Brighton, GB",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-5386-4658-8",
   doi = "10.1109/ICASSP.2019.8683722",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12099"
}
Nahoru