Fakulta informačních technologií VUT v Brně

Detail předmětu

Získávání znalostí z databází

ZZN Ak. rok 2011/2012 zimní semestr 5 kreditů

Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí -  asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.

Garant předmětu

Jazyk výuky

česky

Zakončení

zápočet+zkouška (písemná)

Rozsah

39 hod. přednášky, 13 hod. projekty

Bodové hodnocení

51 zkouška, 15 půlsemestrální test, 34 projekty

Zajišťuje ústav

Přednášející

Cvičící

Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT)
Burgetová Ivana, Ing., Ph.D. (UIFS FIT VUT)
Hlosta Martin, Ing. (UIFS FIT VUT)
Šebek Michal, Ing. (UIFS FIT VUT)

Získané dovednosti, znalosti a kompetence z předmětu

Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází. Jsou schopni nástroje pro získávání znalostí používat i vytvářet.

Cíle předmětu

Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.

Literatura studijní

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  
  • Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9. 
  • Zendulka, J. a kol.: Získávání znalostí z databází. FIT VUT v Brně, 160 s., 2009. (elektronicky)
  • Zendulka, J., Kunc, M., Stryka, L.: Získávání znalostí z databází. FIT. Extrakce informací a získávání znalostí na Webu. FIT VUT v Brně, 65 s., 2010. (elektronicky)

Literatura referenční

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  
  • Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9. 
  • Dunham, M.H.: Data Mining. Introductory and Advanced Topics. Pearson Education, Inc., 2003, 315 p.

Osnova přednášek

  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie. 
  2. Datové sklady a technologie OLAP pro získávání znalostí z databází.
  3. Předzpracování dat v procesu získávání znalostí - metody předzpracování.
  4. Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
  5. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
  6. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  7. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  8. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
  9. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody. Další metody shlukování.
  10. Úvod do dolování v proudech dat, časových řadách a posloupnostech.
  11. Úvod do dolování v grafech, časoprostorových datech a datech pohybujících se objektů.
  12. Dolování v biologických datech.
  13. Dolování textu a na webu.

Osnova ostatní - projekty, práce

  • Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z databází.

Průběžná kontrola studia

Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu.

Kontrolovaná výuka

Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu. Pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body.

Podmínky zápočtu

Udělení zápočtu je podmíněno vypracováním projektu a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.

Zařazení předmětu ve studijních plánech

Nahoru