Detail práce

Recommender System for Web Articles

Bakalářská práce Student: Kočí Jan Akademický rok: 2018/2019 Vedoucí: Fajčík Martin, Ing.
Název česky
Doporučovací systém pro webové články
Jazyk práce
anglický
Abstrakt

Tématem této bakalářské práce jsou doporučovací systémy pro webové články. Tato práce nejdříve uvádí nejpopulárnější metody z této oblasti a vysvětluje jejich principy, následně navrhuje požití vlastní architektury, založené na neuronových sítích, která aplikuje metodu Skip-gram negative sampling na problematiku doporučování. V další části pak implementuje tuto architekturu společně s několika dalšími modely, požívající algoritmus SVD, collaborative filtering s algoritmem ALS a také metodu Doc2Vec k vytvoření vektorové reprezentace z obsahu získaných článků. Na závěr vytváří tři evaluační metriky, konkrétně metriky RANK, Recall at k a Precision at k, a vyhodnocuje kvalitu implementovaných modelů srovnáním výsledků s nejmodernějšími modely. Kromě toho také diskutuje o roli a smyslu doporučovacích systémů ve společnosti a uvádí motivaci pro jejich používání.

Klíčová slova

Doporučovací systémy, Strojové učení, Hluboké učení, Zpracování textu, Kolaborativní filtrování, Faktorizace matic, Filtrování založené na obsahu.

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
14. června 2019
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Otázky u obhajoby

1) Why was the negative sampling chosen instead of the complete objective function, given that the dataset is of moderate size? Why only 20 negative samples?
2) The experiments showed that the proposed skip-gram based under-performs as compared to the baseline ALS system. What are the reasons? (Apart from the size of the dataset)

Komise
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), předseda
Hliněná Dana, doc. RNDr., Ph.D. (UMAT FEKT VUT), člen
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Orság Filip, Ing., Ph.D. (UITS FIT VUT), člen
Rychlý Marek, RNDr., Ph.D. (UIFS FIT VUT), člen
Citace
KOČÍ, Jan. Recommender System for Web Articles. Brno, 2019. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-14. Vedoucí práce Fajčík Martin. Dostupné z: https://www.fit.vut.cz/study/thesis/22020/
BibTeX
@bachelorsthesis{FITBT22020,
    author = "Jan Ko\v{c}\'{i}",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Recommender System for Web Articles",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/22020/"
}
Nahoru