Detail práce
Určování typů a atributů entit napříč jazyky
Cílem této práce je analýza článků na internetové encyklopedii Wikipedii a převod jejich textu psaného v přirozeném jazyce na strukturovanou databázi osob, míst a dalších entit. Podstatou implementovaného programu je určení typu entity na základě typických znaků, které ji charakterizují, a extrakce nejdůležitějších atributů této entity v českém a slovenském jazyce. Výsledkem práce je báze znalostí umožňující snadné vyhledávání a třídění informací. Díky snadné rozšiřitelnosti je možné do programu přidat identifikaci dalších typů entit a dalších vlastností, případně i podporu jiných jazyků.
Wikipedie, extrakce informací, analýza textu, atributy entit
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E.
- Na straně 14 píšete: "Na české Wikipedii program dosahuje úspěšnosti 98 %, na slovenské verzi 96 %." Můžete komisi vysvětlit, jak jste k těmto číslům dospěl? V práci to není dostatečně vysvětleno.
- Na straně 29 píšete: "Systém převádí wikitext na prostý text s vysokou úspěšností." Čím můžete toto tvrzení podložit? V práci to není uvedeno.
- Existují nějaké další systémy a porovnal jste je se svým?
- Obsahuje práce porovnání s dalšími systémy?
Fučík Otto, doc. Dr. Ing. (UPSY FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
Veselý Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT21926, author = "Daniel \v{S}vub", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Ur\v{c}ov\'{a}n\'{i} typ\r{u} a atribut\r{u} entit nap\v{r}\'{i}\v{c} jazyky", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2019, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/21926/" }