Detail práce

Codec Detection from Speech

Bakalářská práce Student: Jon Josef Akademický rok: 2016/2017 Vedoucí: Černocký Jan, prof. Dr. Ing.
Název česky
Codec Detection from Speech
Jazyk práce
anglický
Abstrakt

Tato práce se zabývá detekcí kodeků z komprimovaného řečového signálu. Cílem bylo zjistit, jaké charakteristiky rozlišují jednotlivé kodeky a následně vytvořit prostředí vhodné pro experimenty s různými typy a konfiguracemi klasifikátorů. Použity byly Support vector machines a především neuronové sítě, které byly vytvořeny pomocí nástroje Keras. Hlavním přínosem této práce je experimentální část, ve které je analyzován vliv různých parametrů neuronové sítě. Po nalezení nejvhodnější kombinace parametrů dosáhla síť přesnosti klasifikace přes 98% na testovací sadě obsahující data z 6 kodeků.

Klíčová slova

Neuronové sítě, klasifikace kodeků, zpracování řeči, LPC, Keras, strojové učení, Supportvector machines, SVM, GRU, LSTM, kodek

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
16. června 2017
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Otázky u obhajoby
  1. Co je to PCA (Principal Component Analysis), k čemu se používá a k čemu byste ji mohl využít ve vaší práci.
  2. Může ovlivnit výsledek trénování u RNN/LSTM když na vstup sítě dáme více rámců a nebo připojím delta a double-delta (rychlostní a akcelerační) coeficienty = vstup je již s časovým kontextem?


Komise
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT), předseda
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Hliněná Dana, doc. RNDr., Ph.D. (UMAT FEKT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Ryšavý Ondřej, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Citace
JON, Josef. Codec Detection from Speech. Brno, 2017. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2017-06-16. Vedoucí práce Černocký Jan. Dostupné z: https://www.fit.vut.cz/study/thesis/18356/
BibTeX
@bachelorsthesis{FITBT18356,
    author = "Josef Jon",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Codec Detection from Speech",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2017,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/18356/"
}
Nahoru