Detail práce
Automatizovaná analýza WWW stránek
Cílem této práce je vytvoření aplikace na analýzu WWW stránek. K implementaci aplikace byl zvolen jazyk Java, konkrétně framework JavaFX s použitím grafové databáze OrientDB. Vytvořená aplikace dokáže procházet WWW domény menšího rozsahu. Aplikace je užitečná jako nástroj k sestavení struktury WWW stránek.
Webový pavouk, HTML, analýza webových stránek, jsoup, PhantomJS, JavaFX, OrientDB
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm "C".
- Jakým způsobem ve vaší aplikaci můžete omezit nebo povolit procházené stránky (whilelist a blacklist)? Jak byste implementovala možnost procházet pouze zadanou část domény?
- Zkuste navrhnout způsob (polo)automatického rozpoznání špatného návratového kódu (typicky vracení 200 místo chyby 404).
- Jak byste řešila procházení dynamicky generovaného webu? Jaké vidíte největší problémy takového úkolu?
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
Zbořil František, doc. Ing., Ph.D. (UITS FIT VUT), člen
@bachelorsthesis{FITBT17885, author = "Nikita Va\v{n}k\r{u}", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Automatizovan\'{a} anal\'{y}za WWW str\'{a}nek", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2015, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/17885/" }