Detail práce
Codec Detection from Speech
Tato práce se zabývá detekcí kodeků z komprimovaného řečového signálu. Cílem bylo zjistit, jaké charakteristiky rozlišují jednotlivé kodeky a následně vytvořit prostředí vhodné pro experimenty s různými typy a konfiguracemi klasifikátorů. Použity byly Support vector machines a především neuronové sítě, které byly vytvořeny pomocí nástroje Keras. Hlavním přínosem této práce je experimentální část, ve které je analyzován vliv různých parametrů neuronové sítě. Po nalezení nejvhodnější kombinace parametrů dosáhla síť přesnosti klasifikace přes 98% na testovací sadě obsahující data z 6 kodeků.
Neuronové sítě, klasifikace kodeků, zpracování řeči, LPC, Keras, strojové učení, Supportvector machines, SVM, GRU, LSTM, kodek
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
- Co je to PCA (Principal Component Analysis), k čemu se používá a k čemu byste ji mohl využít ve vaší práci.
- Může ovlivnit výsledek trénování u RNN/LSTM když na vstup sítě dáme více rámců a nebo připojím delta a double-delta (rychlostní a akcelerační) coeficienty = vstup je již s časovým kontextem?
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Hliněná Dana, doc. RNDr., Ph.D. (UMAT FEKT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Ryšavý Ondřej, doc. Ing., Ph.D. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT18356, author = "Josef Jon", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Codec Detection from Speech", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2017, location = "Brno, CZ", language = "english", url = "https://www.fit.vut.cz/study/thesis/18356/" }