Detail práce

Speech Analysis for Processing of Musical Signals

Diplomová práce Student: Mészáros Tomáš Akademický rok: 2014/2015 Vedoucí: Černocký Jan, prof. Dr. Ing.
Název česky
Speech Analysis for Processing of Musical Signals
Jazyk práce
anglický
Abstrakt
Hlavním cílem této práce je obohatit hudební signály charakteristikami
lidské řeči. Práce zahrnuje tvorbu audioefektu inspirovaného efektem
talk-box: analýzu hlasového ústrojí vhodným algoritmem jako je
lineární predikce, a aplikaci odhadnutého filtru na hudební
audio-signál. Důraz je kladen na dokonalou kvalitu výstupu, malou
latenci a nízkou výpočetní náročnost pro použití v reálném čase.
Výstupem práce je softwarový plugin využitelný v profesionálních
aplikacích pro úpravu audia a při využití vhodné hardwarové platformy
také pro živé hraní. Plugin emuluje reálné zařízení typu talk-box a
poskytuje podobnou kvalitu výstupu s unikátním zvukem.
Klíčová slova

Lineární predikce, Audio syntéza, Kódování řeči, Modelování zvukových efektů, VST pluginy, LADSPA, DAW, Zpracování signálů

Ústav
Studijní program
Informační technologie, obor Počítačová grafika a multimédia
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
23. června 2015
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A

Otázky u obhajoby
- Is the plugin applicable to instruments other than guitar?
- How robust is the system against e.g. background noise, different mics, echo/reverb., etc.
- Have you considered sub-frame division, e.g. 5ms for LSP/LSF interpolation to achieve a smoother LP envelope evolution?
- The conclusion that min. 41 - 192 LP coefficients are needed to achieve accurate representation of the LP envelope seems not correct to me? Did you try measuring the spectral distance with Itakura-Saito?
- Some spectral analysis of the "overdrive" effect would be welcome. What it does spectrally?
Komise
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), předseda
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), člen
Rychlý Marek, RNDr., Ph.D. (UIFS FIT VUT), člen
Strnadel Josef, Ing., Ph.D. (UPSY FIT VUT), člen
Šlapal Josef, prof. RNDr., CSc. (UM OADM FSI VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
MÉSZÁROS, Tomáš. Speech Analysis for Processing of Musical Signals. Brno, 2015. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2015-06-23. Vedoucí práce Černocký Jan. Dostupné z: https://www.fit.vut.cz/study/thesis/17400/
BibTeX
@mastersthesis{FITMT17400,
    author = "Tom\'{a}\v{s} M\'{e}sz\'{a}ros",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Speech Analysis for Processing of Musical Signals",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2015,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/17400/"
}
Nahoru