Detail předmětu
Konvoluční neuronové sítě
KNN Ak. rok 2023/2024 letní semestr 5 kreditů
Řešení založená na metodách strojového učení postupně nahrazují ručně navržená řešení v mnoha oblastech vývoje software, speciálně pak v percepčních úlohách zaměřených na získávání informací o reálném světě z informačně bohatých senzorů jako jsou kamery, mikrofony a podobně. Dominantní metodou strojového učení jsou v současné době neuronové sítě, a speciálně pak jejich varianty zaměřené na strukturovaná data - konvoluční neuronové sítě. Tyto přístupy jsou jádrem mnoha úspěšných komerčních aplikací a posunují možnosti umělé inteligence.
Garant předmětu
Koordinátor předmětu
Jazyk výuky
Zakončení
Rozsah
- 26 hod. přednášky
- 26 hod. projekty
Bodové hodnocení
- 35 bodů půlsemestrální test (písemná část)
- 65 bodů projekty
Zajišťuje ústav
Přednášející
Cíle předmětu
Seznámit se s konovlučními neuronovými sítěmi, jejich možnostmi, limity a s jejich praktickým využitím převážně v úlohách zpracování obrazu a počítačového vidění s částečným přesahem do zpracování řeči a jazyka. Umožnit absolventům samostatně používat konvoluční sítě v praktických aplikacích a celkově navrhovat řešení založená na konvolučních sítích včetně struktury sítí, jejich učení, tvorby datových sad a vyhodnocení kvality výsledku.
Studenti se seznámí se základy konvolučních neuronových sítí, jejich učení (optimalizace), jejich stavebními bloky a programovými prostředími (frameworky) pro jejich implementaci. Získají základní povědomí o faktorech, které určují jejich úspěšnost v reálných aplikacích včetně vlastností datové sady, vhodnosti chybové funkce, vhodné struktury sítě, regularizace, optimalizace, přetrénování sítí a multi-task učení. Studenti se také seznámí s konkrétními příklady neuronových sítí pro široké spektrum úloh počítačového vidění (klasifikace, detekce, segmentace, identifikace), zpracování řeči, jazykového modelování, posilovaného učení a generování dat.
Studenti si vyzkouší spolupráci na týmovém projektu a seznámí se s knihovnami jazyka Python zaměřenými na matematické operace, lineární algebru a strojové učení.
Proč je předmět vyučován
Tento předmět využijete, ať už je vaším cílem pracovat jako odborník na umělou inteligenci v předních nadnárodních společnostech jako je Google či Facebook, chcete posunovat hranice umělé inteligence ve špičkovém akademickém týmu, nebo si jen tak chcete rozšířit obzory o současnosti umělé inteligence. Neuronové sítě jsou dnes jádrem mnoha komerčních aplikací od přepisu řeči, vyhledávání obrázků podle jejich obsahu a inteligentních dohledových systémů, až po konverzační systémy a autonomní automobily. Zároveň jsou neuronové sítě i hnací silou současného pokroku ve výzkumu a vývoji umělé inteligence. V tomto předmětu získáte základní povědomí o tom, jak takové sítě fungují a jak se prakticky používají. Zároveň vám představíme konkrétní příklady praktických sítí pro úlohy zpracování obrazu, zvuku a textu.
Požadované prerekvizitní znalosti a dovednosti
Základní znalosti lineární algebry (násobení vektorů a matic), diferenciálního počtu (parciální derivace a její význam, řetězcové pravidlo), jazyka Python a intuitivní pochopení teorie pravděpodobnosti (např. podmíněná pravděpodobnost). Jakékoliv znalosti strojového učení a zpracování obrazu jsou výhodou.
Technické vybavení
volně dostupné
- Python, PyTorch, Numpy, Matplotlib, OpenCV.
Literatura studijní
- Goodfellow, I., Bengio, Y., Courville, A.: Deep Learning. MIT Press, 2016.
- Li, Fei-Fei, et al.: CS231n: Convolutional Neural Networks for Visual Recognition. Stanford, 2018.
- Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
Osnova přednášek
-
- Úvod, lineární modely, chybová funkce, alg. učení (optimalizace), vyhodnocení. (organizace, opakování NN)
- Plně propojené sítě, chybové funkce pro klasifikaci a regresi.(prezentace)
- Konvoluční sítě, lokalita a invariance výpočtů, inicializace vah vah, batch normalizace. (prezentace, ukázka vlivu inicializace vah)
- Existující architektury klasifikačních sítí pro obraz. (prezentace)
- Generalizace, regularizace, rozšiřování datových sad, transfer learning, multi-task sítě, semi supervised learning, active learning, self-supervised learning. (prezentace)
- Detekce objektů: MTCNN face detektor, R-CNN, Fast R-CNN, Faster R-CNN, YOLO, SSD. (prezentace včetně následující segmentace)
- Sémantická segmentace a segmentace instancí. Odhad vzdáleností, normál povrchu, osvětlení a pohybu (prezentace je stejná jako předchozí).
- Sítě pro učení podobností a embedding. Rozpoznávání osob podle obličeje a hlasu. (prezentace)
- Rekurentní neuronové sítě a zpracování sekvencí (textu a řeči). Connectionist Temporal Classification (CTC). Sítě s pozorností. (prezentace)
- Jazykové modely. Základní modely pro generování popisů obrázků, odpovědi na otázky, překlad jazyka a podobně.(prezentace)
- Generativní modely. Autoregresivní faktorizace. Generative Adversarial Networks. (prezentace)
- Posilované učení s neuronovými sítěmi. Deep Q-network (DQN) a policy gradients. (prezentace)
- Grafové neuronové sítě. (prezentace)
Odkazy jsou na živé prezentace a je pravděpodobné, že se budou během semestru mírně měnit k lepšímu.
Pokud máte návrhy na zlepšení, odkazy na zajímavé zdroje nebo najdete v prezentacích chyby, budu rád, když přidáte komentáře přímo ke konkrétním snímkům prezentací.
Osnova ostatní - projekty, práce
Týmový projekt (2-3 studenti).
Libovolná témata navržená studenty a odsouhlasená vyučujícím.
Postup řešení projektu:
- Formulace úlohy a utvoření týmu.
- Průzkum existujících řešení a použitelných nástrojů.
- Základní řešení a návrh vyhodnocování.
- Sběr dat.
- Experimenty, testování a postupné vylepšení řešení.
- Závěrečná zpráva a prezentace projektu.
Průběžná kontrola studia
- Hodnocený projekt s obhajobou - 65 bodů.
- Dva testy během semestru - 35 bodů.
Podmínky zápočtu
Získání alespoň 50 bodů z hodnocených částí předmětu.
Zařazení předmětu ve studijních plánech