Detail práce

Shlukování slov podle významu

Diplomová práce Student: Jadrníček Zbyněk Akademický rok: 2014/2015 Vedoucí: Smrž Pavel, doc. RNDr., Ph.D.
Název anglicky
Word Sense Clustering
Jazyk práce
český
Abstrakt

Tato práce se zabývá problémem sémantické podobnosti slov v angličtině. Čtenář je nejprve informován o teorii shlukování slov podle významu, poté jsou popsány některé metody a nástroje související s tématem. V praktické části navrhneme a implementujeme systém pro výpočet sémantické podobnosti slov využívající nástroj Word2Vec, konkrétně se zaměříme na biomedicínské texty z databáze MEDLINE. Na závěr práce budeme diskutovat dosažené výsledky a předložíme několik návrhů, jak systém vylepšit.

Klíčová slova
biomedicínská data, sémantická podobnost, tokenizace, vektorový prostorový model, Word2Vec, zpracování přirozeného jazyka
Ústav
Studijní program
Informační technologie, obor Bioinformatika a biocomputing
Soubory
Stav
obhájeno, hodnocení E
Obhajoba
22. června 2015
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "E".

Otázky u obhajoby
  1. Proč jste při řešení úkolů ze Semevalu nepoužil lemmatizaci ani stemming?
  2. V kapitole 8.1 píšete, že vzhledem k počtu vytvořených modelů zde neuvádíte všechny výsledky, ale pouze výsledky pro tři vybrané modely. Můžete komisi ukázat kompletní výsledky pro všechny modely?
  3. V práci píšete, že Váš systém dosáhl úspěšnosti 93%. Můžete komisi objasnit, jak jste k tomuto číslu dospěl?
Komise
Sekanina Lukáš, prof. Ing., Ph.D. (UPSY FIT VUT), předseda
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Meduna Alexander, prof. RNDr., CSc. (UIFS FIT VUT), člen
Steingartner William, Ing., Ph.D. (TUKE), člen
Zbořil František, doc. Ing., Ph.D. (UITS FIT VUT), člen
Citace
JADRNÍČEK, Zbyněk. Shlukování slov podle významu. Brno, 2015. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2015-06-22. Vedoucí práce Smrž Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/9519/
BibTeX
@mastersthesis{FITMT9519,
    author = "Zbyn\v{e}k Jadrn\'{i}\v{c}ek",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Shlukov\'{a}n\'{i} slov podle v\'{y}znamu",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2015,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/9519/"
}
Nahoru