Detail práce
Strojové učení v oblasti stylometrie a určování autorství
Práce se zabývá identifikací autorů anglických internetových komentářů. Popisuje aktuální stav v oboru určování autorství na sociálních sítích. Vysvětluje fungování a strukturu vytvořeného systému na určování autorství, který funguje na základě výběru nejinformativnějších příznaků z převážně písmemnných n-gramů a slovních druhů. Prezentuje výsledky testování systému na internetových službách Quora a Twitter.
určování autorství, strojové učení, výběr příznaků, quora, twitter
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
- Rozveďte význam charakteristiky písemných n-gramů a diskutujte jejich efekt na krátkých textech z Twitteru v porovnání s delšími texty.
- Stručně zdůvodněte příčinu lepších výsledků dosažených s metodou výběru příznaků "informační přínos" oproti jiným metodám.
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT18623, author = "Karel Dr\'{a}pela", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Strojov\'{e} u\v{c}en\'{i} v oblasti stylometrie a ur\v{c}ov\'{a}n\'{i} autorstv\'{i}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2016, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/18623/" }