Detail předmětu

Strojové učení a rozpoznávání

SUR Ak. rok 2019/2020 letní semestr 5 kreditů

Klasifikační úloha a rozpoznávání vzorů, základní schéma klasifikátoru, data a vyhodnocování úspěšnosti jednotlivých metod, statistické rozpoznávání vzorů, extrakce příznaků, baysovské učení, odhad s maximální věrohodnosti (ML), vícerozměrné Gaussovo rozložení, směs gaussovských rozložení (GMM), algoritmus maximalizace očekávání (EM algoritmus), lineární klasifikátory, perceptron, gaussovský lineární klasifikátor, logistická regrese, SVM, dopředné neuronové sítě, konvoluční a rekurentní neuronové sítě, rozpoznávání sekvencí, skryté Markovovy modely (HMM). Aplikace probraných metod na zpracování řeči a obrazu.

Garant předmětu

Zástupce garanta předmětu

Jazyk výuky

český

Zakončení

zkouška (kombinovaná)

Rozsah

26 hod. přednášky, 13 hod. cvičení, 13 hod. projekty

Bodové hodnocení

60 zkouška, 15 půlsemestrální test, 25 projekty

Zajišťuje ústav

Přednášející

Cvičící

Získané dovednosti, znalosti a kompetence z předmětu

Studenti se v rámci předmětu seznámí s problematikou strojového učení aplikovaného na problém klasifikace a rozpoznávání vzorů. Naučí se aplikovat základní algoritmy a modely v této oblasti na vybrané problémy zpracování mluvené řeči a počítačové grafiky. Porozumí rozdílům mezi jednotlivými metodami a dokáží využít výhod existujících klasifikátorů při řešení prakticky orientovaných projektů.

Dovednosti, znalosti a kompetence obecné

Studenti se seznámí s knihovnami jazyka python zaměřenými na matematické operace, lineární algebru a strojové učení. Zdokonalí se v praktickém užívání matematiky (teorie pravděpodobnosti, statistika, lineární algebra, ...) a programátorských nástrojů. Naučí se řešit týmové projekty.

Cíle předmětu

Porozumět základům strojového učení se zaměřením na problém klasifikace a rozpoznávání vzorů. Naučit se aplikovat základní algoritmy a metody v této oblasti na problémy rozpoznávání mluvené řeči a obrazu. Pochopit základní principy různých generativních a diskriminativních modelů pro statistického rozpoznávání vzorů. Seznámit se se způsoby vyhodnocování úspěšnosti těchto metod..

Proč je předmět vyučován

V současné době jsme svědky velkého rozmachu aplikací využívajících strojové učení či automatické rozpoznávání vzorů. Množí se nám různá zařízení jež je možné ovládat hlasem čí gesty. Digitální foťáky samy detekují obličeje ve snímaném obraze, aby na ně automaticky zaostřily či nějak reagovaly. Virtuální asistenti v mobilních telefonech umí rozpoznat řeč a vyhledat relevantní odpovědi na naše dotazy. Kvalita automatického rozpoznávání identity člověka z hlasové nahrávky nebo fotky obličeje již dnes výrazně přesahuje lidské schopnosti.

V tomto předmětu studenti získají dobrou představu o tom jak tyto technologie fungují. Seznámí se se základním algoritmy a modely, které se z dat samy učí jak rozpoznávat netriviální vzory v audio nahrávkách, obrázcích či jiných signálech a vstupních datech.

Prerekvizity

Požadované prerekvizitní znalosti a dovednosti

Základní znalost běžného matematického formalismu.

Literatura studijní

  • Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
  • Hart, P. E., Stork, D. G.:Pattern Classification (2nd ed), John Wiley &Sons, 2000, ISBN: 978-0-471-05669-0.

Literatura referenční

  • Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
  • Hart, P. E., Stork, D. G.:Pattern Classification (2nd ed), John Wiley & Sons, 2000, ISBN: 978-0-471-05669-0.
  • Ian Goodfellow, Yoshua Bengio, and Aaron Courville. 2016. Deep Learning. The MIT Press.

Osnova přednášek

  1. Úlohy klasifikace a rozpoznávání, základní schéma klasifikátoru, datové množiny a vyhodnocování úspěšnosti.
  2. Pravděpodobnostní rozdělení, statistické rozpoznávání vzorů.
  3. Generativní a diskriminativní modely.
  4. Vícerozměrné gaussovo rozložení, odhad parametrů s maximální věrohodností.
  5. Směs gaussovských rozložení (GMM), maximalizace očekávání  (EM).
  6. Extrakce příznaků, Mel-frekvenční kepstrální koeficienty.
  7. Aplikace pravděpodobnostních modelů ve zpracování řeči a obrazu.
  8. Lineární klasifikátory, perceptron
  9. Gaussovský lineární klasifikátor, logistická regrese
  10. Support vector machines (SVM), jádrové (kernel) funkce
  11. Neuronové sítě - dopředné, konvoluční a rekurentní
  12. Skryté markovovy modely (HMM) a jejich aplikace na rozpoznávání řeči.
  13. Prezentace projektů

Osnova ostatní - projekty, práce

  • Individuálně zadávané projekty

Průběžná kontrola studia

  • Půlsemestrální test - až 15 bodů
  • Projekt - až 25 bodů
  • Závěrečná písemná zkouška - až 60 bodů

Kontrolovaná výuka

Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny.

Rozvrh

DenTypTýdnyMístn.OdDoPSKSkupInfo
Útpřednáškavýuky D0206 17:0018:50 1MIT 2BIA 2BIB 2MIT 3BIT xx
Útcvičenívýuky D0206 19:0019:50 1MIT 2BIA 2BIB 2MIT 3BIT xx

Zařazení předmětu ve studijních plánech

Nahoru