Detail práce

Určování typů a atributů entit napříč jazyky

Bakalářská práce Student: Švub Daniel Akademický rok: 2018/2019 Vedoucí: Smrž Pavel, doc. RNDr., Ph.D.
Název anglicky
Identifying Entity Types and Attributes Across Languages
Jazyk práce
český
Abstrakt

Cílem této práce je analýza článků na internetové encyklopedii Wikipedii a převod jejich textu psaného v přirozeném jazyce na strukturovanou databázi osob, míst a dalších entit. Podstatou implementovaného programu je určení typu entity na základě typických znaků, které ji charakterizují, a extrakce nejdůležitějších atributů této entity v českém a slovenském jazyce. Výsledkem práce je báze znalostí umožňující snadné vyhledávání a třídění informací. Díky snadné rozšiřitelnosti je možné do programu přidat identifikaci dalších typů entit a dalších vlastností, případně i podporu jiných jazyků.

Klíčová slova

Wikipedie, extrakce informací, analýza textu, atributy entit

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení E
Obhajoba
10. června 2019
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E.

Otázky u obhajoby
  1. Na straně 14 píšete: "Na české Wikipedii program dosahuje úspěšnosti 98 %, na slovenské verzi 96 %." Můžete komisi vysvětlit, jak jste k těmto číslům dospěl? V práci to není dostatečně vysvětleno.
  2. Na straně 29 píšete: "Systém převádí wikitext na prostý text s vysokou úspěšností." Čím můžete toto tvrzení podložit? V práci to není uvedeno.
  3. Existují nějaké další systémy a porovnal jste je se svým?
  4. Obsahuje práce porovnání s dalšími systémy?
Komise
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT), předseda
Fučík Otto, doc. Dr. Ing. (UPSY FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
Veselý Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Citace
ŠVUB, Daniel. Určování typů a atributů entit napříč jazyky. Brno, 2019. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-10. Vedoucí práce Smrž Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/21926/
BibTeX
@bachelorsthesis{FITBT21926,
    author = "Daniel \v{S}vub",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Ur\v{c}ov\'{a}n\'{i} typ\r{u} a atribut\r{u} entit nap\v{r}\'{i}\v{c} jazyky",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/21926/"
}
Nahoru