Fakulta informačních technologií VUT v Brně

Detail předmětu

Zpracování řečových signálů

ZRE Ak. rok 2017/2018 letní semestr 5 kreditů

Aplikace počítačového zpracování řeči, číslicové zpracování řečových signálů, tvorba a slyšení řeči, úvod do fonetiky, předzpracování a základní parametry, lineárně-prediktivní model, cepstrum, určování základního tónu hlasu, kódování - časová oblast a vokodéry, rozpoznávání - DTW a HMM, syntéza. Software a knihovny pro zpracování řeči.

Garant předmětu

Jazyk výuky

česky

Zakončení

zkouška (písemná)

Rozsah

26 hod. přednášky, 2 hod. cvičení, 12 hod. pc laboratoře, 12 hod. projekty

Bodové hodnocení

51 zkouška, 14 půlsemestrální test, 6 laboratoře, 29 projekty

Zajišťuje ústav

Přednášející

Cvičící

Mošner Ladislav, Ing. (UPGM FIT VUT)
Skácel Miroslav, Ing. (UPGM FIT VUT)
Žmolíková Kateřina, Ing. (UPGM FIT VUT)

Získané dovednosti, znalosti a kompetence z předmětu

Studenti se seznámí se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Pochopí základní algoritmy analýzy řeči společné mnohým aplikacím. Získají přehled o aplikacích (rozpoznávání, syntéza, kódování) a o praktických stránkách implementace řečových algoritmů. Budou schopni navrhnout jednoduchý systém pro zpracování řeči (detektor řečové aktivity, rozpoznávač několika izolovaných slov), včetně implementace do aplikačních programů.

Cíle předmětu

Seznámit studenty se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Popsat základní algoritmy analýzy řeči společné mnohým aplikacím. Podat přehled aplikací (rozpoznávání, syntéza, kódování) a informovat o praktických stránkách implementace řečových algoritmů.

Literatura studijní

  • Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN  80-200-0203-0
  • Gold, B., Morgan, N.: Speech and Audio Signal Processing, John Wiley & Sons, 2000, ISBN 0-471-35154-7

Literatura referenční

  • Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN  80-200-0203-0
  • Gold, B., Morgan, N.: Speech and Audio Signal Processing, John Wiley & Sons, 2000, ISBN 0-471-35154-7 
  • Krčmová, N.: Fonetika a fonologie: zvuková stavba současné češtiny. ISBN 80-210-0137-2. Masarykova univerzita, Brno, 1990
  • Rabiner, L., Juang, B.H.: Fundamentals of Speech Recognition, Signal Processing, Prentice Hall, Engelwood Cliffs, NJ, 1993, ISBN 0-13-015157-2 

Osnova přednášek

  • Úvod, aplikace zpracování řeči, relevatní vědní obory,  informační obsah.
  • Číslicové zpracování řečových signálů
  • Tvorba a slyšení řeči, základní pojmy z psychoakustiky, aplikace ve zpracování řeči.
  • Úvod do fonetiky, mezinárodní normy pro označování fonémů.
  • Předzpracování a základní parametry. 
  • Lineárně-prediktivní model, spektrum pomocí lineární predikce. Aplikace LP. 
  • Cepstrální analýza, Mel-frekvenční cepstrum
  • Určování základního tónu hlasu
  • Kódování řeči.
  • Rozpoznávání řeči, dynamické programování DTW, skryté Markovovy modely HMM
  • Syntéza řeči
  • Software a knihovny pro zpracování řeči.

Osnova numerických cvičení

  • Paramatrizace, DTW, HMM.
  • Prezentace projektů.

Průběžná kontrola studia

  • půlsemestrální test 14b
  • projekty 29b
  • presentace výsledků na poč. cvičeních 6b

Kontrolovaná výuka

Výuka není povinná, v případě nepřítomnosti v laboratořích lze nahradit ztrátu bodů následujícím způsobem: 
  1. přijít do jiné skupiny, ve které se probírá ta samá laboratorní úloha. 
  2. na následující laboratoři cvičícímu krátce předvést výsledky ze zameškané laboratoře. 
  3. zaslat  cvičícímu do 14 dní zaslat krátký protokol sumarizující výsledky zameškané laboratoře a obsahující odpovědi na otázky ze zadání. 

Zařazení předmětu ve studijních plánech

  • Program IT-MGR-2, obor MBI, MMI, libovolný ročník, povinně volitelný skupina S
  • Program IT-MGR-2, obor MBS, MIS, MMM, libovolný ročník, volitelný
  • Program IT-MGR-2, obor MGM, 1. ročník, povinný
  • Program IT-MGR-2, obor MIN, libovolný ročník, povinně volitelný skupina C
  • Program IT-MGR-2, obor MPV, libovolný ročník, povinně volitelný skupina G
  • Program IT-MGR-2, obor MSK, 2. ročník, povinně volitelný skupina B
Nahoru