Detail práce
Segmentace webových stránek s využitím shlukování
Tato zpráva se zabývá segmentací webových stránek, jež je důležitou součástí oboru extrakce informací. V první části popisujeme několik obecných způsobů jak se dá implementovat. Následně je pak představena metoda Box Clustering Segmentation, ktrerá přichází s mírně odlišným přístupem k segmentaci. V druhé polovině práce je pak popsána implementace této metody v rámci nástroje FITLayout a závěrečné testování.
Segmentace webových stránek, extrakce informací, algoritmus Box Clustering Segmentation, framework FITLayout
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "B".
- Existuje nějaký způsob, jak lze uživateli doporučit vhodnou hodnotu parametru CT (shlukový práh)?
- Jaké jsou výsledky implementované segmentační metody pro stránky neobsahující hlavní článek (např. osobní stránka zaměstnance fakulty)?
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Očenášek Pavel, Mgr. Ing., Ph.D. (UIFS FIT VUT), člen
Trenz Oldřich, doc. Ing., Ph.D. (Mendelu), člen
Zendulka Jaroslav, doc. Ing., CSc. (UIFS FIT VUT), člen
@mastersthesis{FITMT19293, author = "Tom\'{a}\v{s} Leng\'{a}l", type = "Diplomov\'{a} pr\'{a}ce", title = "Segmentace webov\'{y}ch str\'{a}nek s vyu\v{z}it\'{i}m shlukov\'{a}n\'{i}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2017, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/19293/" }