Extrakce dat z webu
Aka webscraping
Aka webscraping
Doc. Ing. Radek Burget, Ph.D.
burgetr@fit.vutbr.cz
Když potřebujeme rychle a jednorázově data z jednoduššího webu a nikdo se nás nebude ptát, jak jsme to udělali.
Když regulární výrazy nestačí.
Když se ke stránce nedá dostat na jeden HTTP GET.
Je analýza HTML kódu jediná možnost?
Mohou stroje pracovat za nás (programátory)?
Demo kód:
https://github.com/DIFS-Teaching/webscraping
Dotazy?