Detail práce
Získávání znalostí z textových dat
Tato diplomová práce pojednává o tzv. "dolování dat", tedy získávání takových informací z databází, které nejsou přímo viditelné, ale které lze pomocí speciálních algoritmů z databází získat. Zaměřuje se na klasifikaci dokumentů do tříd v rámci digitální knihovny, vybranou metodou, která je založena na množinách položek tzv. "metoda itemsets". Tato metoda rozšiřuje oblast aplikace Apriori algoritmu určeného původně ke zpracování transakčních databází a generování frekventovaných množin položek. Práce se rovněž zabývá možností modifikace vlastního Apriori algoritmu pro potřeby klasifikace metodou itemsets.
dolování dat, transakční databáze, množina položek, klasifikace, digitální knihovna, Apriori algoritmus, metoda itemsets, frekventovaná množina položek
@mastersthesis{FITMT5824, author = "Lud\v{e}k Sm\'{e}kal", type = "Diplomov\'{a} pr\'{a}ce", title = "Z\'{i}sk\'{a}v\'{a}n\'{i} znalost\'{i} z textov\'{y}ch dat", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2007, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/5824/" }