Detail práce
Extrakce dat z popisu zboží
Diplomová práce
Student: Sláma Vojtěch
Akademický rok: 2007/2008
Vedoucí: Burget Radek, doc. Ing., Ph.D.
Název anglicky
Data Extraction from Product Descriptions
Jazyk práce
český
Abstrakt
Tato práce se zabývá návrhem a implementací systému pro automatizovanou podporu sběru informací o zboží pro účely elektronických obchodů. Uvádí přehled existujících přístupů pro extrakci informací z HTML dokumentů, zejména se zaměřuje na wrappery a metody jejich automatické konstrukce. Zmíněn je i vizuální přístup k extrakci dat z dokumentů. V části zabývající se návrhem jsou formalizovány požadavky na systém a navrženy základní principy systému. Implementační část obsahuje podrobný popis algoritmu pro hledání cest ve stromu dokumentu. V závěru práce jsou zhodnoceny výsledky dosažené při experimentech.
Klíčová slova
Extrakce informací, wrapper, indukce wrapperu, elektronický obchod, e-shop, JavaScript, DOM.
Ústav
Studijní program
Informační technologie, obor
Informační systémy
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
16. června 2008
Oponent
Komise
Švéda Miroslav, prof. Ing., CSc. (UIFS FIT VUT), předseda
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Drahanský Martin, prof. Ing., Dipl.-Ing., Ph.D. (UITS FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
Šafařík Jiří, prof. Ing., CSc. (ZČU v Plzni), člen
Vojnar Tomáš, prof. Ing., Ph.D. (UITS FIT VUT), člen
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Drahanský Martin, prof. Ing., Dipl.-Ing., Ph.D. (UITS FIT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
Šafařík Jiří, prof. Ing., CSc. (ZČU v Plzni), člen
Vojnar Tomáš, prof. Ing., Ph.D. (UITS FIT VUT), člen
Citace
SLÁMA, Vojtěch. Extrakce dat z popisu zboží. Brno, 2008. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2008-06-16. Vedoucí práce Burget Radek. Dostupné z: https://www.fit.vut.cz/study/thesis/7080/
BibTeX
@mastersthesis{FITMT7080, author = "Vojt\v{e}ch Sl\'{a}ma", type = "Diplomov\'{a} pr\'{a}ce", title = "Extrakce dat z popisu zbo\v{z}\'{i}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2008, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/7080/" }