Detail práce
Generátor vědeckých webových portálů
Generátor vědeckých webových portálů. Celistvý projekt, jehož součástí je tato diplomová práce, se skládá z uživatelského prostředí GUI, komunikace procesů, komunikace programu s uživatelem a ze skriptu pro automatické rozpoznávání vyjmenované entity metodou extrakce sémantické informace ze značkovaného textu. Poslední jmenovaná část je hlavní náplní mé diplomové práce. Cílem diplomové práce je skript (prototyp), který na základě vstupního XML souboru se jmény vědeckých pracovníků vrací výstupní XML soubor s URL adresami na jejich domovské stránky a stránky s výpisem publikací. Značná část mé práce bude věnována shromáždění kvalitních testovacích dat a nakonec důkladné statistické analýze výsledného chování skriptu, který jsem naprogramoval. Tato část nám podá ucelený obraz o procentuální úspěšnosti a rychlosti navrženého skriptu. Skript bude připraven pro začlenění do společného projektu.
Python, XML, HTML, UrlLib, lXML, lXML eTree a xml.dom.minidom knihovna, Internet, URL, Web, Google.com, Yahoo.com, Yahoo Search API, Google API.
@mastersthesis{FITMT6032, author = "Milo\v{s} Kundr\'{a}t", type = "Diplomov\'{a} pr\'{a}ce", title = "Gener\'{a}tor v\v{e}deck\'{y}ch webov\'{y}ch port\'{a}l\r{u}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/6032/" }