Detail práce
Porovnávání anotačních nástrojů
Táto práca sa zaoberá problematikou porovnávania anotačných nástrojov pri práci s rozličnými dátovými sadami a získaním výsledkov porovnávania použiteľných pre vylepšenie znalostnej bázy anotátorov. V práci sú analyzované existujúce riešenia a ich nedostatky, z ktorých sú vyvodené požiadavky na nové riešenie. Ďalšie časti sa zaoberajú návrhom, implementáciou a testovaním výsledného nástroja, ktorý je v závere zhodnotený a sú navrhnuté možné rozšírenia do budúcna.
Anotačné nástroje, rozpoznávanie pomenovaných entít, porovnanie výsledkov, identifikácia chýb, spracovanie prirodzeného jazyka, SEC, NER, veľké dáta
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
- V práci uvádíte, že po dokončení testů bylo zjištěno, že průměrně 80 % času identifikace chyb zabírá komunikace s MediaWiki API. Nebylo by tedy lepší ke zjišťování přesměrování používat stažený dump Wikipedie? Proč k tomu používáte MediaWiki API?
- Jak Váš nástroj pozná, jestli budete číst uspořádaný nebo neuspořádaný soubor ve formátu NIF? Je potřeba mu to explicitně uvést a nebo to umí detekovat sám?
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Hliněná Dana, doc. RNDr., Ph.D. (UMAT FEKT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Ryšavý Ondřej, doc. Ing., Ph.D. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT20061, author = "D\'{a}vid Prexta", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Porovn\'{a}v\'{a}n\'{i} anota\v{c}n\'{i}ch n\'{a}stroj\r{u}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2017, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/20061/" }