Detail předmětu

Strojové učení a rozpoznávání

SUR Ak. rok 2021/2022 letní semestr 5 kreditů

Klasifikační úloha a rozpoznávání vzorů, základní schéma klasifikátoru, data a vyhodnocování úspěšnosti jednotlivých metod, statistické rozpoznávání vzorů, extrakce příznaků, baysovské učení, odhad s maximální věrohodnosti (ML), vícerozměrné Gaussovo rozložení, směs gaussovských rozložení (GMM), algoritmus maximalizace očekávání (EM algoritmus), lineární klasifikátory, perceptron, gaussovský lineární klasifikátor, logistická regrese, SVM, dopředné neuronové sítě, konvoluční a rekurentní neuronové sítě, rozpoznávání sekvencí, skryté Markovovy modely (HMM). Aplikace probraných metod na zpracování řeči a obrazu.

Garant předmětu

Burget Lukáš, doc. Ing., Ph.D. (UPGM)

Koordinátor předmětu

Černocký Jan, prof. Dr. Ing. (UPGM)

Jazyk výuky

čeština

Zakončení

zkouška (kombinovaná)

Rozsah

26 hod. přednášky
13 hod. cvičení
13 hod. projekty

Bodové hodnocení

60 bodů závěrečná zkouška (písemná část)
15 bodů půlsemestrální test (písemná část)
25 bodů projekty

Zajišťuje ústav

Ústav počítačové grafiky a multimédií (UPGM)

Přednášející

Burget Lukáš, doc. Ing., Ph.D. (UPGM)

Cvičící

Burget Lukáš, doc. Ing., Ph.D. (UPGM)

Získané dovednosti, znalosti a kompetence z předmětu

Studenti se v rámci předmětu seznámí s problematikou strojového učení aplikovaného na problém klasifikace a rozpoznávání vzorů. Naučí se aplikovat základní algoritmy a modely v této oblasti na vybrané problémy zpracování mluvené řeči a počítačové grafiky. Porozumí rozdílům mezi jednotlivými metodami a dokáží využít výhod existujících klasifikátorů při řešení prakticky orientovaných projektů.
Studenti se seznámí s knihovnami jazyka python zaměřenými na matematické operace, lineární algebru a strojové učení. Zdokonalí se v praktickém užívání matematiky (teorie pravděpodobnosti, statistika, lineární algebra, ...) a programátorských nástrojů. Naučí se řešit týmové projekty.

Cíle předmětu

Porozumět základům strojového učení se zaměřením na problém klasifikace a rozpoznávání vzorů. Naučit se aplikovat základní algoritmy a metody v této oblasti na problémy rozpoznávání mluvené řeči a obrazu. Pochopit základní principy různých generativních a diskriminativních modelů pro statistického rozpoznávání vzorů. Seznámit se se způsoby vyhodnocování úspěšnosti těchto metod..

Proč je předmět vyučován

V současné době jsme svědky velkého rozmachu aplikací využívajících strojové učení či automatické rozpoznávání vzorů. Množí se nám různá zařízení jež je možné ovládat hlasem čí gesty. Digitální foťáky samy detekují obličeje ve snímaném obraze, aby na ně automaticky zaostřily či nějak reagovaly. Virtuální asistenti v mobilních telefonech umí rozpoznat řeč a vyhledat relevantní odpovědi na naše dotazy. Kvalita automatického rozpoznávání identity člověka z hlasové nahrávky nebo fotky obličeje již dnes výrazně přesahuje lidské schopnosti.

V tomto předmětu studenti získají dobrou představu o tom jak tyto technologie fungují. Seznámí se se základním algoritmy a modely, které se z dat samy učí jak rozpoznávat netriviální vzory v audio nahrávkách, obrázcích či jiných signálech a vstupních datech.

Doporučené prerekvizity

Signály a systémy (ISS)
Základy počítačové grafiky (IZG)

Požadované prerekvizitní znalosti a dovednosti

Základní znalost běžného matematického formalismu.

Literatura studijní

Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
Hart, P. E., Stork, D. G.:Pattern Classification (2nd ed), John Wiley & Sons, 2000, ISBN: 978-0-471-05669-0.
Ian Goodfellow, Yoshua Bengio, and Aaron Courville. 2016. Deep Learning. The MIT Press.

Literatura referenční

https://www.fit.vutbr.cz/study/courses/SUR/public/

Osnova přednášek

Úlohy klasifikace a rozpoznávání, základní schéma klasifikátoru, datové množiny a vyhodnocování úspěšnosti.
Pravděpodobnostní rozdělení, statistické rozpoznávání vzorů.
Generativní a diskriminativní modely.
Vícerozměrné gaussovo rozložení, odhad parametrů s maximální věrohodností.
Směs gaussovských rozložení (GMM), maximalizace očekávání (EM).
Extrakce příznaků, Mel-frekvenční kepstrální koeficienty.
Aplikace pravděpodobnostních modelů ve zpracování řeči a obrazu.
Lineární klasifikátory, perceptron
Gaussovský lineární klasifikátor, logistická regrese
Support vector machines (SVM), jádrové (kernel) funkce
Neuronové sítě - dopředné, konvoluční a rekurentní
Skryté markovovy modely (HMM) a jejich aplikace na rozpoznávání řeči.
Prezentace projektů

Osnova numerických cvičení

Demonstrační cvičení (1h týdně) navazují na přednášku a demonstrují studentům přednášené techniky na datech a reálném kódu. Kód a data pro příklady budou k dispozici studentům.

Osnova ostatní - projekty, práce

Individuálně zadávané projekty

Průběžná kontrola studia

Půlsemestrální test - až 15 bodů
Projekt - až 25 bodů
Závěrečná písemná zkouška - až 60 bodů

Kontrolovaná výuka

Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny.

Zařazení předmětu ve studijních plánech

Program MITAI, obor NADE, NBIO, NCPS, NEMB, NGRI, NHPC, NIDE, NISD, NISY, NMAT, NNET, NSEC, NSEN, NVER, NVIZ, libovolný ročník, volitelný
Program MITAI, obor NISY do 2020/21, NMAL, NSPE, libovolný ročník, povinný