Fakulta informačních technologií VUT v Brně

Detail předmětu

Získávání znalostí z databází

ZZN Ak. rok 2009/2010 zimní semestr 5 kreditů

Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - charakterizace a diskriminace, asociační pravidla, klasifikace a predikce, shlukování. Dolování ve složitě strukturovaných datech. Trendy v získávání znalostí z dat. Řešení projektu zaměřeného na dolování dat využitím dostupného nástroje.

Garant předmětu

Jazyk výuky

česky

Zakončení

zápočet+zkouška (písemná)

Rozsah

39 hod. přednášky, 13 hod. projekty

Bodové hodnocení

51 zkouška, 15 půlsemestrální test, 34 projekty

Zajišťuje ústav

Přednášející

Cvičící

Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT)
Fiala Jiří, Ing. (UIFS FIT VUT)
Jaša Petr, Ing. (UIFS FIT VUT)

Získané dovednosti, znalosti a kompetence z předmětu

Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází. Jsou schopni nástroje pro získávání znalostí používat i vytvářet.

Cíle předmětu

Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.

Literatura studijní

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  
  • Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9. 

Literatura referenční

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  
  • Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9. 
  • Dunham, M.H.: Data Mining. Introductory and Advanced Topics. Pearson Education, Inc., 2003, 315 p.

Osnova přednášek

  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie. 
  2. Datové sklady a technologie OLAP pro získávání znalostí z databází.
  3. Předzpracování dat v procesu získávání znalostí - metody předzpracování.
  4. Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
  5. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
  6. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  7. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  8. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
  9. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody. Další metody shlukování.
  10. Úvod do dolování v proudech dat, časových řadách a posloupnostech, grafech.
  11. Úvod do multirelačního dolování a dolování v prostorových a multimediálních datech. Problematika zajištění ochrany soukromí při dolování v datech.
  12. Dolování v biologických datech.
  13. Dolování textu a na webu.

Osnova ostatní - projekty, práce

  • Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z databází.

Průběžná kontrola studia

Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu.

Kontrolovaná výuka

Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu. Pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body.

Podmínky zápočtu

Udělení zápočtu je podmíněno vypracováním projektu a ziskem minimálně 25 bodů za bodované aktivity v průběhu semestru.

Zařazení předmětu ve studijních plánech

Nahoru