Detail práce

Shlukování slov podle významu

Bakalářská práce Student: Haljuk Petr Akademický rok: 2014/2015 Vedoucí: Smrž Pavel, doc. RNDr., Ph.D.
Název anglicky
Word Sense Clustering
Jazyk práce
český
Abstrakt

Tato bakalářská práce se zabývá sémantickou podobností slov. Popisuje návrh a implementaci systému, který vyhledává nejpodobnější slova a určuje sémantickou podobnost vět. Systém využívá model Word2Vec z knihovny GenSim. Vztahy mezi slovy se model učí analýzou korpusu CommonCrawl.

Klíčová slova
zpracování přirozeného jazyka, sémantická podobnost, GenSim, Word2Vec
Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
18. června 2015
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "C".

Otázky u obhajoby
  1. Proč jste zvolil velikost vektoru 300 a velikost kontextového okna 5 pro metodu CBOW, resp. 10 pro Skip-gram? Zkoušel jste s těmito hodnotami nějak experimentovat? Pokud by tyto hodnoty byly vyšší, dosažené výsledky by byly pravděpodobně lepší.
  2. Jaké rychlosti jste dosahoval při trénování modelu? Spouštěl jste trénování paralelně? Jaká byla rychlost výpočtu podobných slov?
Komise
Zbořil František V., doc. Ing., CSc. (UITS FIT VUT), předseda
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Drábek Vladimír, doc. Ing., CSc. (UPSY FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Rogalewicz Adam, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Citace
HALJUK, Petr. Shlukování slov podle významu. Brno, 2015. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2015-06-18. Vedoucí práce Smrž Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/17717/
BibTeX
@bachelorsthesis{FITBT17717,
    author = "Petr Haljuk",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Shlukov\'{a}n\'{i} slov podle v\'{y}znamu",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2015,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/17717/"
}
Nahoru