Detail práce
Aplikace pro sumarizaci textu
V této práci jsem se zaměřil na implementaci webové aplikace, která slouží jako prostředek pro automatickou tvorbu souhrnů v anglickém jazyce. Automatická tvorba souhrnů je v řešení prováděna pomocí metody TextRank a Latentní sémantické analýzy. Obě tyto metody jsou vylepšeny o rozpoznávání pojmenovaných entit. Přínosem této práce je zjištění, že využití rozpoznávání pojmenovaných entit u Latentní sémantické analýzy a především u metody TextRank, vede k vytváření kvalitnějších souhrnů. Tato kvalita souhrnů byla ověřena pomocí metrik ROUGE.
sumarizace textu, zpracování přirozeného jazyka, ROUGE, Python, TextRank, Latentní sémantická analýza, lematizace, stematizace, pojmenované entity, stop slova, tokenizace
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Provedené experimenty byly zaměřeny odděleně na varianty používající algoritmus TextRank a algoritmus LSA. Můžete je na základě dosažených výsledků porovnat vzájemně?
- Jaký je stav v oblasti sumarizace pro texty v češtině?
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Kreslíková Jitka, doc. RNDr., CSc. (UIFS FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
@bachelorsthesis{FITBT21653, author = "Jakub Mi\v{c}ka", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Aplikace pro sumarizaci textu", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2019, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/21653/" }