Detail předmětu

Strojové učení a rozpoznávání

SUR Ak. rok 2021/2022 letní semestr 5 kreditů

Aktuální akademický rok

Klasifikační úloha a rozpoznávání vzorů, základní schéma klasifikátoru, data a vyhodnocování úspěšnosti jednotlivých metod, statistické rozpoznávání vzorů, extrakce příznaků, baysovské učení, odhad s maximální věrohodnosti (ML), vícerozměrné Gaussovo rozložení, směs gaussovských rozložení (GMM), algoritmus maximalizace očekávání (EM algoritmus), lineární klasifikátory, perceptron, gaussovský lineární klasifikátor, logistická regrese, SVM, dopředné neuronové sítě, konvoluční a rekurentní neuronové sítě, rozpoznávání sekvencí, skryté Markovovy modely (HMM). Aplikace probraných metod na zpracování řeči a obrazu.

Garant předmětu

Koordinátor předmětu

Jazyk výuky

česky

Zakončení

zkouška (kombinovaná)

Rozsah

  • 26 hod. přednášky
  • 13 hod. cvičení
  • 13 hod. projekty

Bodové hodnocení

  • 60 bodů závěrečná zkouška (písemná část)
  • 15 bodů půlsemestrální test (písemná část)
  • 25 bodů projekty

Zajišťuje ústav

Přednášející

Cvičící

Získané dovednosti, znalosti a kompetence z předmětu

Studenti se v rámci předmětu seznámí s problematikou strojového učení aplikovaného na problém klasifikace a rozpoznávání vzorů. Naučí se aplikovat základní algoritmy a modely v této oblasti na vybrané problémy zpracování mluvené řeči a počítačové grafiky. Porozumí rozdílům mezi jednotlivými metodami a dokáží využít výhod existujících klasifikátorů při řešení prakticky orientovaných projektů.
Studenti se seznámí s knihovnami jazyka python zaměřenými na matematické operace, lineární algebru a strojové učení. Zdokonalí se v praktickém užívání matematiky (teorie pravděpodobnosti, statistika, lineární algebra, ...) a programátorských nástrojů. Naučí se řešit týmové projekty.

Cíle předmětu

Porozumět základům strojového učení se zaměřením na problém klasifikace a rozpoznávání vzorů. Naučit se aplikovat základní algoritmy a metody v této oblasti na problémy rozpoznávání mluvené řeči a obrazu. Pochopit základní principy různých generativních a diskriminativních modelů pro statistického rozpoznávání vzorů. Seznámit se se způsoby vyhodnocování úspěšnosti těchto metod..

Proč je předmět vyučován

V současné době jsme svědky velkého rozmachu aplikací využívajících strojové učení či automatické rozpoznávání vzorů. Množí se nám různá zařízení jež je možné ovládat hlasem čí gesty. Digitální foťáky samy detekují obličeje ve snímaném obraze, aby na ně automaticky zaostřily či nějak reagovaly. Virtuální asistenti v mobilních telefonech umí rozpoznat řeč a vyhledat relevantní odpovědi na naše dotazy. Kvalita automatického rozpoznávání identity člověka z hlasové nahrávky nebo fotky obličeje již dnes výrazně přesahuje lidské schopnosti.

V tomto předmětu studenti získají dobrou představu o tom jak tyto technologie fungují. Seznámí se se základním algoritmy a modely, které se z dat samy učí jak rozpoznávat netriviální vzory v audio nahrávkách, obrázcích či jiných signálech a vstupních datech.

Doporučené prerekvizity

Požadované prerekvizitní znalosti a dovednosti

Základní znalost běžného matematického formalismu.

Literatura studijní

  • Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
  • Hart, P. E., Stork, D. G.:Pattern Classification (2nd ed), John Wiley & Sons, 2000, ISBN: 978-0-471-05669-0.
  • Ian Goodfellow, Yoshua Bengio, and Aaron Courville. 2016. Deep Learning. The MIT Press.

Literatura referenční

Osnova přednášek

  1. Úlohy klasifikace a rozpoznávání, základní schéma klasifikátoru, datové množiny a vyhodnocování úspěšnosti.
  2. Pravděpodobnostní rozdělení, statistické rozpoznávání vzorů.
  3. Generativní a diskriminativní modely.
  4. Vícerozměrné gaussovo rozložení, odhad parametrů s maximální věrohodností.
  5. Směs gaussovských rozložení (GMM), maximalizace očekávání  (EM).
  6. Extrakce příznaků, Mel-frekvenční kepstrální koeficienty.
  7. Aplikace pravděpodobnostních modelů ve zpracování řeči a obrazu.
  8. Lineární klasifikátory, perceptron
  9. Gaussovský lineární klasifikátor, logistická regrese
  10. Support vector machines (SVM), jádrové (kernel) funkce
  11. Neuronové sítě - dopředné, konvoluční a rekurentní
  12. Skryté markovovy modely (HMM) a jejich aplikace na rozpoznávání řeči.
  13. Prezentace projektů

Osnova numerických cvičení

Demonstrační cvičení (1h týdně) navazují na přednášku a demonstrují studentům přednášené techniky na datech a reálném kódu. Kód a data pro příklady budou k dispozici studentům.

Osnova ostatní - projekty, práce

  • Individuálně zadávané projekty

Průběžná kontrola studia

  • Půlsemestrální test - až 15 bodů
  • Projekt - až 25 bodů
  • Závěrečná písemná zkouška - až 60 bodů

Kontrolovaná výuka

Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny.

Zařazení předmětu ve studijních plánech

Nahoru