Detail předmětu
Zpracování řečových signálů (v angličtině)
ZREe Ak. rok 2023/2024 letní semestr 5 kreditů
Aplikace počítačového zpracování řeči, číslicové zpracování řečových signálů, tvorba a slyšení řeči, úvod do fonetiky, předzpracování a základní parametry, lineárně-prediktivní model, cepstrum, určování základního tónu hlasu, kódování - časová oblast a vokodéry, rozpoznávání - DTW a HMM, syntéza. Software a knihovny pro zpracování řeči.
Garant předmětu
Jazyk výuky
Zakončení
Rozsah
- 26 hod. přednášky
- 26 hod. pc laboratoře
Bodové hodnocení
- 75 bodů závěrečná zkouška
- 25 bodů půlsemestrální test
Zajišťuje ústav
Přednášející
Cvičící
Cíle předmětu
Seznámit studenty se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Popsat základní algoritmy analýzy řeči společné mnohým aplikacím. Podat přehled aplikací (rozpoznávání, syntéza, kódování) a informovat o praktických stránkách implementace řečových algoritmů.
Studenti se seznámí se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Pochopí základní algoritmy analýzy řeči společné mnohým aplikacím. Získají přehled o aplikacích (rozpoznávání, syntéza, kódování) a o praktických stránkách implementace řečových algoritmů. Budou schopni navrhnout jednoduchý systém pro zpracování řeči (detektor řečové aktivity, rozpoznávač několika izolovaných slov), včetně implementace do aplikačních programů.
Osnova přednášek
- Úvod, aplikace zpracování řeči, relevatní vědní obory, informační obsah.
- Číslicové zpracování řečových signálů
- Tvorba a slyšení řeči, základní pojmy z psychoakustiky, aplikace ve zpracování řeči.
- Úvod do fonetiky, mezinárodní normy pro označování fonémů.
- Předzpracování a základní parametry.
- Lineárně-prediktivní model, spektrum pomocí lineární predikce. Aplikace LP.
- Cepstrální analýza, Mel-frekvenční cepstrum
- Určování základního tónu hlasu
- Kódování řeči.
- Rozpoznávání řeči, dynamické programování DTW, skryté Markovovy modely HMM
- Syntéza řeči
- Software a knihovny pro zpracování řeči.
Osnova počítačových cvičení
- V laboratořích (kromě poslední) je používán Matlab.
- Rámce, okna, spektrum, předzpracování.
- Lineární predikce (LPC).
- Určování základního tónu.
- Kódování.
- Rozpoznávání - Dynamic time Warping (DTW).
- Rozpoznávání - skryté Markovovy modely (Hidden Markov Model Toolkit - HTK).
Průběžná kontrola studia
- půlsemestrální test
- prezentace projektů
- presentace výsledků na poč. cvičeních
Rozvrh
Den | Typ | Týdny | Místn. | Od | Do | Kapacita | PSK | Skup | Info |
---|---|---|---|---|---|---|---|---|---|
Po | zkouška | 2024-05-06 | E105 | 09:00 | 10:50 | 1. termín | |||
Po | zkouška | 2024-05-27 | E104 | 16:00 | 17:50 | 3. termín | |||
St | zkouška | 2024-05-15 | E105 | 15:00 | 16:50 | 2. termín | |||
Čt | přednáška | výuky | A112 | 16:00 | 17:50 | 64 | 1EIT 2EIT INTE | MGMe xx | Grézl |
Pá | poč. lab | výuky | N203 | 10:00 | 11:50 | 20 | 1EIT 2EIT INTE | MGMe xx | Grézl |
Pá | zkouška | 2024-03-22 | N103 | 15:00 | 16:00 | pulsemestrálni zkouška |
Zařazení předmětu ve studijních plánech
- Program IT-MGR-2 (anglicky), obor MGMe, 1. ročník, povinný
- Program MIT-EN (anglicky), libovolný ročník, volitelný