Detail práce
Metody pro získávání asociačních pravidel z dat
Cieľom práce je implementácia metódy Multipass-Apriori pre získavanie asociačných pravidiel z textových dát. Po úvode do problematiky dolovania z dát je spomenutá špecifickosť dolovania znalostí z textových dát. Veľmi dôležitú úlohu v tomto procese zohráva predspracovanie, v tomto prípade najmä použitie stemmingu, a vytvorenie slovníka nepotrebných slov (stopwords). Významu, využitiu a procesu získavania asociačných pravidiel je venovaná ďalšia časť práce. Najväčšia pozornosť je venovaná metóde Multipass-Apriori, ktorá bola naimplementovaná a bol popísaný princíp jej fungovania. Na základe vykonaných testov bol stanovený optimálny spôsob rozdelenia partícií a spôsob usporiadania množín. Pri praktických testoch bola metóda Multipass-Apriori porovnávaná s metódou Apriori.
frekventovaná množina, asociačné pravidlo, Apriori, Multipass-Apriori, stemming, slovník nepotrebných slov, predspracovanie textových dát
Hanáček Petr, doc. Dr. Ing. (UITS FIT VUT), člen
Krejčíček Jaromír, prof. Ing., CSc. (UNOB), člen
Křena Bohuslav, Ing., Ph.D. (UITS FIT VUT), člen
Sumec Stanislav, Ing., Ph.D. (UPGM FIT VUT), člen
Zbořil František, doc. Ing., Ph.D. (UITS FIT VUT), člen
@mastersthesis{FITMT4771, author = "Martin Uhl\'{i}\v{r}", type = "Diplomov\'{a} pr\'{a}ce", title = "Metody pro z\'{i}sk\'{a}v\'{a}n\'{i} asocia\v{c}n\'{i}ch pravidel z dat", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2007, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/4771/" }