Fakulta informačních technologií VUT v Brně

Detail předmětu

Získávání znalostí z databází

ZZN Ak. rok 2019/2020 zimní semestr 5 kreditů

Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí -  asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.

Garant předmětu

Zástupce garanta předmětu

Jazyk výuky

český

Zakončení

zápočet+zkouška (písemná)

Rozsah

39 hod. přednášky, 13 hod. projekty

Bodové hodnocení

51 zkouška, 15 půlsemestrální test, 34 projekty

Zajišťuje ústav

Přednášející

Cvičící

Získané dovednosti, znalosti a kompetence z předmětu

  • Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází.
  • Jsou schopni nástroje pro získávání znalostí používat i vytvářet.

Dovednosti, znalosti a kompetence obecné

  • Student se naučí odborné terminologii v českém i anglickém jazyce.
  • Student získá zkušenost s řešením projektů v malém týmu.
  • Student se zdokonalí v prezentaci a obhajobě výsledků projektu.

Cíle předmětu

Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.

Proč je předmět vyučován

Vzhledem k neustále rostoucím objemům dat ukládaným v současnosti v databázích je potřeba hledat v datech pomocí pokročilých metod nové znalosti, které nelze získat běžným dotazováním. Proto je potřeba se seznámit s celým procesem získávání znalostí, který zahrnuje předzpracování dat i samotné získávání znalostí, kde jsou využívány metody z různých oborů, jako např. strojové učení nebo statistika.

Požadované prerekvizitní znalosti a dovednosti

  • Znalost základů pravděpodobnosti a statistiky.
  • Znalost databázových technologií na úrovni bakalářského předmětu.

Literatura studijní

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
  • Bishop, C.M: Pattern Recognition and Machine Learning. Springer, 2006, 738 p. ISBN 0387310738.
  • Zendulka, J. a kol.: Získávání znalostí z databází. FIT VUT v Brně, 160 s., 2009. (elektronicky)

Literatura referenční

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.

Osnova přednášek

  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie. 
  2. Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
  3. Předzpracování dat v procesu získávání znalostí - metody předzpracování.
  4. Datové sklady a technologie OLAP pro získávání znalostí z databází.
  5. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
  6. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  7. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  8. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
  9. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody.
  10. Další metody shlukování. Dolování v biologických datech.
  11. Úvod do dolování v proudech dat, časových řadách a posloupnostech.
  12. Úvod do dolování v grafech, časoprostorových datech, datech pohybujících se objektů a multimediálních datech.
  13. Dolování textu a na webu.

Osnova ostatní - projekty, práce

  • Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z databází.

Průběžná kontrola studia

Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu.

Kontrolovaná výuka

Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu. Pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body.

Podmínky zápočtu

Udělení zápočtu je podmíněno vypracováním projektu, jeho obhajobou v předepsaných termínech a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.

Rozvrh

DenTypTýdnyMístn.OdDoPSKSkupInfo
Pozkouška2020-02-03 D0207 10:0012:50 1MIT 2MIT 2. oprava
Útpřednáškavýuky D0207 12:0014:50 1MIT 2MIT MBI MIN xx
zkouška2020-01-24 G202 08:0010:50 1MIT 2MIT 1. oprava
zkouška2020-01-10 D105 13:0015:50 1MIT 2MIT řádná

Zařazení předmětu ve studijních plánech

Nahoru