Fakulta informačních technologií VUT v Brně

Detail předmětu

Získávání znalostí z databází

ZZN Ak. rok 2013/2014 zimní semestr 5 kreditů

Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí -  asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.

Garant předmětu

Jazyk výuky

česky

Zakončení

zápočet+zkouška (písemná)

Rozsah

39 hod. přednášky, 13 hod. projekty

Bodové hodnocení

51 zkouška, 15 půlsemestrální test, 34 projekty

Zajišťuje ústav

Přednášející

Cvičící

Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT)
Hlosta Martin, Ing. (UIFS FIT VUT)
Šebek Michal, Ing. (UIFS FIT VUT)

Získané dovednosti, znalosti a kompetence z předmětu

  • Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází.
  • Jsou schopni nástroje pro získávání znalostí používat i vytvářet.

Dovednosti, znalosti a kompetence obecné

  • Student se naučí odborné terminologii v českém i anglickém jazyce.
  • Student získá zkušenost s řešením projektů v malém týmu.
  • Student se zdokonalí v prezentaci a obhajobě výsledků projektu.

Cíle předmětu

Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.

Požadované prerekvizitní znalosti a dovednosti

  • Znalost základů pravděpodobnosti a statistiky.
  • Znalost databázových technologií na úrovni bakalářského předmětu.

Literatura studijní

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  
  • Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9. 
  • Zendulka, J. a kol.: Získávání znalostí z databází. FIT VUT v Brně, 160 s., 2009. (elektronicky)
  • Zendulka, J., Kunc, M., Stryka, L.: Získávání znalostí z databází. FIT. Extrakce informací a získávání znalostí na Webu. FIT VUT v Brně, 65 s., 2010. (elektronicky)

Literatura referenční

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  

 

Osnova přednášek

  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie. 
  2. Datové sklady a technologie OLAP pro získávání znalostí z databází.
  3. Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
  4. Předzpracování dat v procesu získávání znalostí - metody předzpracování.
  5. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
  6. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  7. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  8. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
  9. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody. Další metody shlukování.
  10. Úvod do dolování v proudech dat, časových řadách a posloupnostech.
  11. Úvod do dolování v grafech, časoprostorových datech, datech pohybujících se objektů a multimediálních datech.
  12. Dolování v biologických datech.
  13. Dolování textu a na webu.

Osnova ostatní - projekty, práce

  • Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z databází.

Průběžná kontrola studia

Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu.

Kontrolovaná výuka

Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu. Pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body.

Podmínky zápočtu

Udělení zápočtu je podmíněno vypracováním projektu, jeho obhajobou v předepsaných termínech a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.

Zařazení předmětu ve studijních plánech

  • Program IT-MGR-2, obor MBI, MIN, 2. ročník, povinný
  • Program IT-MGR-2, obor MBS, libovolný ročník, povinně volitelný skupina S
  • Program IT-MGR-2, obor MGM, 2. ročník, volitelný
  • Program IT-MGR-2, obor MIS, 2. ročník, povinně volitelný skupina N
  • Program IT-MGR-2, obor MMI, MMM, libovolný ročník, volitelný
  • Program IT-MGR-2, obor MPV, 1. ročník, povinně volitelný skupina D
  • Program IT-MGR-2, obor MSK, 2. ročník, povinně volitelný skupina M
Nahoru