Detail práce

Lossless Encoding of Signals from Microphone Array

Bakalářská práce Student: Kálazi Adrián Akademický rok: 2021/2022 Vedoucí: Černocký Jan, prof. Dr. Ing.
Název česky
Bezeztrátové kódování signálů z mikrofonního pole
Jazyk práce
anglický
Abstrakt

Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.

Klíčová slova

bezeztrátové kódování řeči, bezeztrátové kódování zvuku, lineární predikce, adaptivní Riceho kódování, dekorelace, zpracování zvuku, dynamické kódování zvuku

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
15. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. What happens to the passive down-mix (d_MID in eq. 4.9) if the two input channels, s_L and s_R, have opposite phase, i.e. effectively cancelling each other? How do you deal with this problem in your codec?
  2. In Fig. 4.14 the "m" parameter seems toggling. Would smoothing or interpolation help?
  3. On page 23 you state that the entropy rises when the input signals are re-scaled to the same energy level. Can you explain how is it possible? I'd expect the exact opposite, i.e. lower energy of the residual signal and, consequently, also lower entropy.


Komise
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), předseda
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Orság Filip, Ing., Ph.D. (UITS FIT VUT), člen
Citace
KÁLAZI, Adrián. Lossless Encoding of Signals from Microphone Array. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-15. Vedoucí práce Černocký Jan. Dostupné z: https://www.fit.vut.cz/study/thesis/24799/
BibTeX
@bachelorsthesis{FITBT24799,
    author = "Adri\'{a}n K\'{a}lazi",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Lossless Encoding of Signals from Microphone Array",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/24799/"
}
Nahoru