Detail práce

Automatizované získávání informací z WWW

Bakalářská práce Student: Žabka Andrej Akademický rok: 2021/2022 Vedoucí: Burget Radek, doc. Ing., Ph.D.
Název anglicky
Automated Retrieval of Information from the WWW
Jazyk práce
český
Abstrakt

Táto bakalárska práca sa zaoberá extrakciou dát z webu (web scraping) a následným zobrazovaním týchto dát. Vytvorený nástroj umožňuje užívateľovi rýchlo a jednoducho vytvoriť celistvý projekt, ktorý dokáže získavať dáta z viacerých webových stránok a zobraziť ich v prívetivej podobe. Taktiež je súčasťou práce aj niekoľko príkladov, ktoré slúžia ako ukážka možností tohto nástroja a boli použité pri jeho testovaní.

Klíčová slova

Web, scraping, zobrazovanie dát, JavaScript, Puppeteer, HTML, DOM, CSS

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
16. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. Bylo by možné nahradit nutnost vložení kódu v Javascriptu něčím přívětivějším pro neznalé uživatele? Co by to případně obnášelo?
  2. Pomocí jakého nástroje jste prováděl web scraping?
Komise
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT), předseda
Kreslíková Jitka, doc. RNDr., CSc. (UIFS FIT VUT), člen
Smrčka Aleš, Ing., Ph.D. (UITS FIT VUT), člen
Strnadel Josef, Ing., Ph.D. (UPSY FIT VUT), člen
Citace
ŽABKA, Andrej. Automatizované získávání informací z WWW. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-16. Vedoucí práce Burget Radek. Dostupné z: https://www.fit.vut.cz/study/thesis/24690/
BibTeX
@bachelorsthesis{FITBT24690,
    author = "Andrej \v{Z}abka",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Automatizovan\'{e} z\'{i}sk\'{a}v\'{a}n\'{i} informac\'{i} z WWW",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/24690/"
}
Nahoru