Detail práce

Robustní detekce řečové aktivity

Diplomová práce Student: Popková Anna Akademický rok: 2018/2019 Vedoucí: Matějka Pavel, Ing., Ph.D.
Název anglicky
Robust Speech Activity Detection
Jazyk práce
český
Abstrakt

Cílem této práce je navrhnout a vytvořit robustní detektor řečové aktivity, který je schopen detekovat řeč v různých jazycích, v prostředí se šumem a v prostředí s hudbou na pozadí. Tento problém jsem se rozhodla vyřešit použitím neuronové sítě jako klasifikačního modelu, který vstupním úsekům nahrávky přiřazuje jednu ze čtyř možných tříd - ticho, řeč, hudbu nebo hluk. Výsledný nástroj je schopný detekovat řeč v minimálně 12-ti jazycích. Řeč na hudebním pozadí až s 88 % úspěšností a výsledky úspěšnosti systému na zašuměných datech dosahují od 84 % (5 dB SNR) do 88 % (20 dB SNR). Tento nástroj je možné použít pro detekci řečové aktivity v různých výzkumných oblastech zpracování řeči. Hlavním jeho přínosem je eliminace hudby, která když odstraněna není, výrazně zvyšuje chybovost systémů na rozpoznávání mluvčího či řeči.

Klíčová slova

Robustní detekce řečové aktivity, Hudba, Šum, Neuronová síť, SNR.

Ústav
Studijní program
Informační technologie, obor Informační systémy
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
14. června 2019
Oponent
Průběh obhajoby

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře.

Otázky u obhajoby
  1. Narazila jste při studiu literatury na analýzu toho jaký vliv má detekce řečové aktivity na úspěšnost cílové aplikace? Dokázala byste kvantifikovat, jaké zlepšení pči detekci řeči už vede k signifikantnímu zlepšení cílové aplikace?
Komise
Kolář Dušan, doc. Dr. Ing. (UIFS FIT VUT), předseda
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Meduna Alexander, prof. RNDr., CSc. (UIFS FIT VUT), člen
Smrčka Aleš, Ing., Ph.D. (UITS FIT VUT), člen
Trenz Oldřich, doc. Ing., Ph.D. (Mendelu), člen
Citace
POPKOVÁ, Anna. Robustní detekce řečové aktivity. Brno, 2019. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-14. Vedoucí práce Matějka Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/21780/
BibTeX
@mastersthesis{FITMT21780,
    author = "Anna Popkov\'{a}",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Robustn\'{i} detekce \v{r}e\v{c}ov\'{e} aktivity",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/21780/"
}
Nahoru