Detail předmětu

Získávání znalostí z databází

ZZN Ak. rok 2007/2008 zimní semestr 5 kreditů

Aktuální akademický rok

Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - charakterizace a diskriminace, asociační pravidla, klasifikace a predikce, shlukování. Dolování ve složitě strukturovaných datech. Trendy v získávání znalostí z dat. Řešení projektu zaměřeného na dolování dat využitím dostupného nástroje.

Garant předmětu

Jazyk výuky

česky

Zakončení

zápočet+zkouška

Rozsah

  • 39 hod. přednášky
  • 13 hod. projekty

Zajišťuje ústav

Získané dovednosti, znalosti a kompetence z předmětu

Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází. Jsou schopni nástroje pro získávání znalostí používat i vytvářet.

Cíle předmětu

Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.

Požadované prerekvizitní znalosti a dovednosti

Nejsou žádné prerekvizity.

Literatura referenční

  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  

 

Osnova přednášek

  • Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí.
  • Datové sklady a technologie OLAP pro získávání znalostí z dat.
  • Předzpracování dat v procesu získávání znalostí.
  • Systémy pro dolování dat - specifikace úlohy, dotazovací jazyky pro dolování, architektura systému.
  • Dolování charakteristik pojmů (tříd) - charakterizace a diskriminace.
  • Dolování asociačních pravidel z transakčních databází.
  • Dolování asociačních pravidel z relačních databází a datových skladů.
  • Klasifikace - rozhodovací strom, bayesovská klasifikace, využití neuronových sítí.
  • Další metody klasifikace. Predikce.
  • Shluková analýza.
  • Dolování ve složitě strukturovaných datech - dolování v objektových, prostorových a textových databázích.
  • Dolování v multimediálních databázích, časových posloupnostech a na WWW.
  • Aplikace a trendy v získávání znalostí z dat.

Průběžná kontrola studia

Udělení zápočtu je podmíněno vypracováním projektu a ziskem minimálně 25 bodů za bodované aktivity v průběhu semestru.

Kontrolovaná výuka

Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu.

Nahoru