Detail práce
Automatická extrakce klíčových slov v češtině
Táto práca sa zaoberá návrhom, implementáciou a testovaním aplikácie pre automatickú extrakciu kľúčových výrazov z odborných textov v českom jazyku. Sú implementované viaceré algoritmy výberu kandidátov a rôzne štatistické a linguistické metódy výpočtu skóre týchto kandidátov. Jednotlivé algoritmy boli analyzované a porovnávané, a tie, ktoré dosiahli v českom jazyku najlepšie výsledky, boli vybrané do finálnej verzie programu.
kľúčové slová, extrakcia, spracovanie prirodzeného jazyka, výrazy
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "E".
- V tabulce 9.1 uvádíte seznam nejčastějších vzorů POS tagů z rejstříků testovacích publikací. Jejich četnosti, ale v práci uvedeny nejsou. Můžete je komisi prezentovat?
- Čím je podle Vás způsobena tak malá úspěšnost Vámi použitých algoritmů? Můžete komisi znovu popsat nejlepší Vámi dosažené výsledky? Jak jste na tom ve srovnání s konkurenčními systémy?
- V práci uvádíte, že je na závěr potřeba identifikované termíny převést do správného tvaru. V práci to ale nijak více nerozebíráte. Jak tedy termíny převádíte do správného tvaru a jaká je úspěšnost převodu? Na jakých tvarech provádíte vyhodnocení Vašeho systému?
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Hliněná Dana, doc. RNDr., Ph.D. (UMAT FEKT VUT), člen
Matoušek Petr, doc. Ing., Ph.D., M.A. (UIFS FIT VUT), člen
Zachariášová Marcela, Ing., Ph.D. (UPSY FIT VUT), člen
@bachelorsthesis{FITBT15374, author = "\'{L}ubom\'{i}r Gallovi\v{c}", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Automatick\'{a} extrakce kl\'{i}\v{c}ov\'{y}ch slov v \v{c}e\v{s}tin\v{e}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2017, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/15374/" }