Detail předmětu

Ukládání a příprava dat

UPA Ak. rok 2025/2026 zimní semestr 5 kreditů

Aktuální akademický rok

Předmět se zaměřuje na moderní databázové systémy jako typické zdroje dat pro získávání znalostí a dále na přípravu dat k získávání znalostí. Jedná se o rozšířené relační (objektově-relační, s podporou pro práci s XML a JSON dokumenty), prostorové a NoSQL databázové systémy. Vysvětlený je odpovídající databázový model, způsob práce s daty a některé metody indexace dat. V kontextu výkladu základních kroků procesu získávání znalostí z dat je věnována pozornost popisným charakteristikám dat a vizualizačním technikám používaným k pochopení dat a jejich vlastností. Dále jsou vysvětleny přístupy řešení typických úloh předzpracování dat pro získávání znalostí, jako je čištění, integrace, transformace, redukce apod. Rovněž jsou prezentovány přístupy k extrakci informace z webu pro účely získávání znalostí, charakterizovány nejčastěji používané jazyky a systémy pro získávání znalostí z dat a je uvedeno několik reálných případových studií.

Garant předmětu

Koordinátor předmětu

Jazyk výuky

česky

Zakončení

zápočet+zkouška (písemná)

Rozsah

  • 26 hod. přednášky
  • 6 hod. seminář
  • 6 hod. pc laboratoře
  • 14 hod. projekty

Bodové hodnocení

  • 56 bodů závěrečná zkouška (písemná část)
  • 20 bodů půlsemestrální test (písemná část)
  • 24 bodů projekty

Zajišťuje ústav

Přednášející

Cvičící

Cíle předmětu

Cílem předmětu je vysvětlit historický vývoj databázových technologií, motivaci získávání znalostí z dat a základní kroky procesu získávání znalostí, vysvětlit podstatu, vlastnosti a použití rozšířených relačních a NoSQL databází jako zdrojů dat pro získávání znalostí a vysvětlit přístupy a metody používané pro pochopení dat a přípravu dat pro získávání znalostí.

Studenti budou schopni ukládat a manipulovat data ve vhodných databázových systémech, zkoumat vlastnosti dat a připravit je pro následné modelování v rámci získávání znalostí.

  • Student lépe zvládne práci s daty v různých situacích.
  • Student se zdokonalí v řešení malých projektů v malém týmu.

Požadované prerekvizitní znalosti a dovednosti

  • Základy relačních databází a jazyka SQL.
  • Objektově orientované paradigma.
  • Základy jazyka XML.
  • Základy výpočetní geometrie.
  • Základy statistiky a pravděpodobnosti.

Osnova přednášek

  1. Úvod do předmětu, objektový přístup v databázích.
  2. NoSQL databáze I - úvod do NoSQL, CAP teorém a BASE, databáze klíč-hodnota a způsob uložení dat, rozdělení (partitioning) a distribuce dat.
  3. NoSQL databáze II - modely dat v NoSQL databázích (sloupcové, dokumentové a grafové databáze), dotazování a agregace dat, NewSQL databáze.
  4. Příprava dat - porozumění datům: popisné charakteristiky, vizualizační techniky, korelační analýza.
  5. Příprava dat - předzpracování I: čištění dat, integrace.
  6. Příprava dat - předzpracování II: redukce dat a řešení nevyváženosti dat, transformace dat, další úlohy předzpracování.
  7. Půlsemestrální zkouška.
  8. Extrakce dat z webu (web scraping).
  9. Sémantický web a propojená data.
  10. Jazyky a systémy pro získávání znalostí z dat, reálné případové studie.
  11. Podpora pro práci s XML a JSON dokumenty v databázích.
  12. Prostorové databáze.
  13. Indexování vícedimenzionálních dat.

Osnova seminářů

  1. Objekty a dokumenty v databázích
  2. NoSQL databáze
  3. Získávání znalostí z dat - příprava dat

Osnova počítačových cvičení

  1. Objekty a dokumenty v databázích
  2. NoSQL databáze
  3. Získávání znalostí z dat - příprava dat

Osnova ostatní - projekty, práce

Vytvoření aplikace pro zpracování rozsáhlých strukturovaných i nestrukturovaných dat, které zahrnuje, mimo jiné, získání a načtení dat, jejich přípravou pro další využití (např. pro získávání znalostí z databází) a tvorbu popisných charakteristik pro zvolená data.

Průběžná kontrola studia

  • Půlsemestrální písemná zkouška, neexistuje náhradní/opravný termín, omluvené neúčasti řeší zástupce garanta.
  • Vypracování a odevzdání výsledků projektu v předepsaných termínech, omluvené neúčasti řeší cvičící.
  • Za aktivity v průběhu semestru (mimo závěrečnou zkoušku) student musí získat nejméně 20 bodů pro získání zápočtu a připuštění k závěrečné zkoušce.
  • Závěrečná zkouška, kde je pro získání bodů ze zkoušky nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body (v opačném případě bude zkouška hodnocena 0 body). Omluvenou neúčast řeší zástupce garanta.

Rozvrh

Den
Typ
Týdny
Místn.
Od
Do
Kapacita
PSK
Skup
Info
Po poč. lab 2., 3., 4., 5., 6., 7., 8., 9., 11., 12., 13. výuky N103 N104 N105 09:0010:5060 1MIT 2MIT xx
Út přednáška 1., 4., 5., 11. výuky E104 E105 E112 15:0016:50294 1MIT 2MIT xx Rychlý
Út přednáška 2., 3., 9. výuky E104 E105 E112 15:0016:50294 1MIT 2MIT xx Burget
Út přednáška 6., 8., 10. výuky E104 E105 E112 15:0016:50294 1MIT 2MIT xx Burgetová
Út přednáška 12., 13. výuky E104 E105 E112 15:0016:50294 1MIT 2MIT xx Kolář
St poč. lab 2., 3., 4., 5., 6., 7., 8., 9., 10., 11., 12., 13. výuky N103 N104 N105 09:0010:5060 1MIT 2MIT xx
Čt poč. lab 2., 3., 4., 5., 6., 7., 8., 9., 10., 11., 12., 13. výuky N103 N104 N105 12:0013:5060 1MIT 2MIT xx
Čt poč. lab 2., 3., 4., 5., 6., 7., 8., 9., 10., 11., 12., 13. výuky N103 N104 N105 14:0015:5060 1MIT 2MIT xx
Čt seminář 1., 4. výuky E104 E105 E112 16:0017:50294 1MIT 2MIT NBIO - NSPE NHPC - NEMB NISY NSEC - NGRI xx Rychlý
Čt seminář 2., 3., 5., 6., 7., 8., 9., 11., 12., 13. výuky E104 E105 E112 16:0017:50294 1MIT 2MIT NBIO - NSPE NHPC - NEMB NISY NSEC - NGRI xx
Čt seminář 2025-11-20 E104 E105 E112 16:0017:50294 1MIT 2MIT NBIO - NSPE NHPC - NEMB NISY NSEC - NGRI xx Burgetová

Zařazení předmětu ve studijních plánech

Nahoru