Detail předmětu

Zpracování řečových signálů

ZRE Ak. rok 2010/2011 letní semestr 5 kreditů

Aktuální akademický rok

Garant předmětu

Jazyk výuky

česky, anglicky

Zakončení

zkouška

Rozsah

  • 26 hod. přednášky
  • 2 hod. cvičení
  • 12 hod. pc laboratoře
  • 12 hod. projekty

Zajišťuje ústav

Literatura studijní

  • Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN  80-200-0203-0
  • Gold, B., Morgan, N.: Speech and Audio Signal Processing, John Wiley & Sons, 2000, ISBN 0-471-35154-7

Literatura referenční

  • Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN  80-200-0203-0 

Osnova přednášek

  • Úvod, aplikace zpracování řeči, relevatní vědní obory,  informační obsah.
  • Číslicové zpracování řečových signálů
  • Tvorba a slyšení řeči, základní pojmy z psychoakustiky, aplikace ve zpracování řeči.
  • Úvod do fonetiky, mezinárodní normy pro označování fonémů.
  • Předzpracování a základní parametry. 
  • Lineárně-prediktivní model, spektrum pomocí lineární predikce. Aplikace LP. 
  • Cepstrální analýza, Mel-frekvenční cepstrum
  • Určování základního tónu hlasu
  • Kódování řeči.
  • Rozpoznávání řeči, dynamické programování DTW, skryté Markovovy modely HMM
  • Syntéza řeči
  • Software a knihovny pro zpracování řeči.

Osnova numerických cvičení

  • Paramatrizace, DTW, HMM.
  • Prezentace projektů.

Osnova počítačových cvičení

  • V laboratořích (kromě poslední) je používán Matlab.
  • Rámce, okna, spektrum, předzpracování.
  • Lineární predikce (LPC).
  • Určování základního tónu.
  • Kódování.
  • Rozpoznávání - Dynamic time Warping (DTW).
  • Rozpoznávání - skryté Markovovy modely (Hidden Markov Model Toolkit - HTK).

Zařazení předmětu ve studijních plánech

Nahoru