Detail práce

Případová studie na dolování z dat v jazyce Python

Bakalářská práce Student: Stoika Anastasiia Akademický rok: 2018/2019 Vedoucí: Zendulka Jaroslav, doc. Ing., CSc.
Název anglicky
Data Mining Case Study in Python
Jazyk práce
český
Abstrakt

Tato práce se zabývá základními koncepty a technikami procesu získávání znalostí z dat. Cílem práce je demonstrovat dostupné prostředky jazyka Python, které umožňují provádět jednotlivé kroky tohoto procesu. Práce je zaměřena především na metody a techniky detekce odlehlých pozorování, založené na shlukování a klasifikaci. Jedná se o řešení analytické úlohy, která se týká zdrojů dat s omezeným množstvím využitelné informace. Tato kontrolní činnost by měla sloužit k detekci podezřelých prodejních transakcí nějaké společnosti, které mohou znamenat pokusy o podvod jejích prodejci.

Klíčová slova

získavání znalostí z dat, datová analýza, detekce odlehlých hodnot, detekce podvodních transakcí, detekce anomalií, analýza odlehlých hodnot, učení bez učitele, učení s učitelem, kombinace učení s učitelem i bez, klasifikace, Bayesovská klasifikace, lokální faktor odlehlosti, předzpracování dat, čištění dat

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení D
Obhajoba
12. června 2019
Oponent
Průběh obhajoby

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm D.

Otázky u obhajoby
  1. Vysvětlete, jakým způsobem byly kategorické atributy IDProd transformovány pro klasifikační model Gaussian Naive Bayes. Neovlivnila tato transformace výsledný klasifikační model (např. vytvořením určitých nových vztahů mezi jednotlivými hodnotami atributů)?
Komise
Hruška Tomáš, prof. Ing., CSc. (UIFS FIT VUT), předseda
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Kreslíková Jitka, doc. RNDr., CSc. (UIFS FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
STOIKA, Anastasiia. Případová studie na dolování z dat v jazyce Python. Brno, 2019. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-12. Vedoucí práce Zendulka Jaroslav. Dostupné z: https://www.fit.vut.cz/study/thesis/22015/
BibTeX
@bachelorsthesis{FITBT22015,
    author = "Anastasiia Stoika",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "P\v{r}\'{i}padov\'{a} studie na dolov\'{a}n\'{i} z dat v jazyce Python",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/22015/"
}
Nahoru