Detail práce
Portál pro agregaci dat z webových zdrojů
Táto práca sa zaoberá extrakciou a následnou agregáciou dát z heterogénnych webových zdrojov. Cieľom je vytvorenie portálu, funkčnej webovej aplikácie, využívajúcej vhodné technológie. Hlavné zameranie práce je na architektúru a samotnú implementáciu aplikácie. Za aplikačnú doménu bolo zvolené ubytovanie, resp. hľadanie prenájmu. Pre extrakciu dát sa využíva API portálu alebo wrapper. Získané dáta sa ukladajú do dokumentovej databázy. V tejto práci sa podarilo navrhnúť a implementovať systém, pomocou ktorého je možné získavať inzeráty s prenájmami bytov z viacerých webových zdrojov zároveň a tie jednotnou formou prezentovať používateľovi na jednom mieste.
web, extrakcia dát, flexibilné dátové modely, heterogénne webové zdroje, zhromažďovanie dát, jednotná prezentácia dát, webový portál
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Pokuste se naznačit, co by obnášelo přidání nového zdroje k agregaci. Zaměřte se i na řešení toho, že v novém zdroji mohou chybět informace, které v dosud podporovaných zdrojích jsou vždy k dispozici.
- Kolik celkem inzerátů jste v rámci sběru dat skutečně ze zmíněných serverů načetl? Opravdu to bylo těch cca 20 tisíc?
- Lze aplikaci nasadit?
Čadík Martin, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holub Jan, prof. Ing., Ph.D. (FIT ČVUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Polčák Libor, Ing., Ph.D. (UIFS FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
@mastersthesis{FITMT21399, author = "Tibor Mikita", type = "Diplomov\'{a} pr\'{a}ce", title = "Port\'{a}l pro agregaci dat z webov\'{y}ch zdroj\r{u}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2019, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/21399/" }