Detail publikace

Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation

ŠEBEK Michal a ZENDULKA Jaroslav. Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation. In: Proceedings of the Twelfth International Conference on Informatics 2013. Košice: Technická univerzita v Košiciach, 2013, s. 289-292. ISBN 978-80-8143-127-2.
Název česky
Generátor syntetických datových sad pro vyhodnocení dolování hierarchických sekvenčních vzorů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Klíčová slova

dolování sekvenčních vzorů, generátory syntetických datových sad, taxonomie

Abstrakt

Evaluace je důležitou součástí návrhu algoritmů. Algoritmy jsou obvykle evaluovány na reálných a syntetických datových sadách. Reálné datové sady jsou vhodné pro hodnocení vlastností algoritmů v praxi, ale je obtížné změnit datovou sadu tak, aby měla nějaké konkrétní statistické vlastnosti, např. počet vstupních položek. Naproti tomu, vygenerované syntetické datové sady umožňují jednoduše provádět jakékoliv změny hodnoty statistické vlastnosti datové sady při zachování všech ostatních vlastností. V příspěvku prezentujeme postup pro generování databází sekvencí s taxonomiemi pro evaluaci algoritmů pro dolování hierarchických sekvenčních vzorů.

Anotace

Evaluace je důležitou součástí návrhu algoritmů. Algoritmy jsou obvykle evaluovány na reálných a syntetických datových sadách. Reálné datové sady jsou vhodné pro hodnocení vlastností algoritmů v praxi, ale je obtížné změnit datovou sadu tak, aby měla nějaké konkrétní statistické vlastnosti, např. počet vstupních položek. Naproti tomu, vygenerované syntetické datové sady umožňují jednoduše provádět jakékoliv změny hodnoty statistické vlastnosti datové sady při zachování všech ostatních vlastností. V příspěvku prezentujeme postup pro generování databází sekvencí s taxonomiemi pro evaluaci algoritmů pro dolování hierarchických sekvenčních vzorů.

Rok
2013
Strany
289-292
Sborník
Proceedings of the Twelfth International Conference on Informatics 2013
Konference
Informatics 2013 - 12th International Scientific Conference on Informatics, Spišská Nová Ves, SK
ISBN
978-80-8143-127-2
Vydavatel
Technická univerzita v Košiciach
Místo
Košice, SK
BibTeX
@INPROCEEDINGS{FITPUB10435,
   author = "Michal \v{S}ebek and Jaroslav Zendulka",
   title = "Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation",
   pages = "289--292",
   booktitle = "Proceedings of the Twelfth International Conference on Informatics 2013",
   year = 2013,
   location = "Ko\v{s}ice, SK",
   publisher = "The University of Technology Ko\v{s}ice",
   ISBN = "978-80-8143-127-2",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/10435"
}
Nahoru