Detail práce

Dolování z dat v jazyce Python

Diplomová práce Student: Šenovský Jakub Akademický rok: 2016/2017 Vedoucí: Zendulka Jaroslav, doc. Ing., CSc.
Název anglicky
Data Mining with Python
Jazyk práce
český
Abstrakt

Cílem této práce bylo seznámení se s jednotlivými fázemi získávání znalostí z dat, s podporou programovacích jazyků Python a R v oblasti dolování dat a demonstrace jejich použití na dvou případových studiích. Následným krokem bylo porovnání těchto jazyků z hlediska dolování dat. Je zde popsaná fáze předzpracování dat a dolovací algoritmy pro klasifikaci, predikci a shlukování. Představeny zde byly významné knihovny pro jazyky Python a R. V první případové studii byla demonstrována práce s časovými řadami pomocí ARIMA modelu a neuronových sítí s ověřením přesnosti pomocí střední kvadratické chyby. V druhé případové studii byla popsaná klasifikace výsledků fotbalových zápasů pomocí k - nejbližších sousedů, Bayesova klasifikátoru, náhodného lesu a logické regrese. Přesnost klasifikace byla zobrazena pomocí skóre přesnosti a konfúzní matice. Práci uzavírá zhodnocení výsledků a návrhy pro budoucí vylepšení jednotlivých modelů.

Klíčová slova

Získávání znalostí, Python, R, předzpracování dat, shlukování, predikce, klasifikace, případové studie, ARIMA, porovnání Python a R, Bayes, knn.

Ústav
Studijní program
Informační technologie, obor Bezpečnost informačních technologií
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
21. června 2017
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "C".

Otázky u obhajoby
  1. Podle jakých kritérií jste volil data pro případové studie? Uvažoval jste i o jiných?
Komise
Hanáček Petr, doc. Dr. Ing. (UITS FIT VUT), předseda
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Švéda Miroslav, prof. Ing., CSc. (UIFS FIT VUT), člen
Veselý Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Zeman Václav, doc. Ing., Ph.D. (UTKO FEKT VUT), člen
Citace
ŠENOVSKÝ, Jakub. Dolování z dat v jazyce Python. Brno, 2017. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2017-06-21. Vedoucí práce Zendulka Jaroslav. Dostupné z: https://www.fit.vut.cz/study/thesis/20060/
BibTeX
@mastersthesis{FITMT20060,
    author = "Jakub \v{S}enovsk\'{y}",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Dolov\'{a}n\'{i} z dat v jazyce Python",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2017,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/20060/"
}
Nahoru