Detail práce

Segmentace webových stránek s využitím shlukování

Diplomová práce Student: Lengál Tomáš Akademický rok: 2016/2017 Vedoucí: Burget Radek, doc. Ing., Ph.D.
Název anglicky
Web Page Segmentation Algorithms Based on Clustering
Jazyk práce
český
Abstrakt

Tato zpráva se zabývá segmentací webových stránek, jež je důležitou součástí oboru extrakce informací. V první části popisujeme několik obecných způsobů jak se dá implementovat. Následně je pak představena metoda Box Clustering Segmentation, ktrerá přichází s mírně odlišným přístupem k segmentaci. V druhé polovině práce je pak popsána implementace této metody v rámci nástroje FITLayout a závěrečné testování.

Klíčová slova

Segmentace webových stránek, extrakce informací, algoritmus Box Clustering Segmentation, framework FITLayout

Ústav
Studijní program
Informační technologie, obor Informační systémy
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
22. června 2017
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "B".

Otázky u obhajoby
  1. Existuje nějaký způsob, jak lze uživateli doporučit vhodnou hodnotu parametru CT (shlukový práh)?
  2. Jaké jsou výsledky implementované segmentační metody pro stránky neobsahující hlavní článek (např. osobní stránka zaměstnance fakulty)?
Komise
Hruška Tomáš, prof. Ing., CSc. (UIFS FIT VUT), předseda
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Očenášek Pavel, Mgr. Ing., Ph.D. (UIFS FIT VUT), člen
Trenz Oldřich, doc. Ing., Ph.D. (Mendelu), člen
Zendulka Jaroslav, doc. Ing., CSc. (UIFS FIT VUT), člen
Citace
LENGÁL, Tomáš. Segmentace webových stránek s využitím shlukování. Brno, 2017. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2017-06-22. Vedoucí práce Burget Radek. Dostupné z: https://www.fit.vut.cz/study/thesis/19293/
BibTeX
@mastersthesis{FITMT19293,
    author = "Tom\'{a}\v{s} Leng\'{a}l",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Segmentace webov\'{y}ch str\'{a}nek s vyu\v{z}it\'{i}m shlukov\'{a}n\'{i}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2017,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/19293/"
}
Nahoru