Detail práce
Nástroj pro predikci atributů životního stylu na základě metagenomických dat z tlustého střeva
Tato práce se zabývá analýzou lidského mikrobiomu na základě metagenomických dat z tlustého střeva. Předmětem zkoumání je zastoupení bakterií na různých taxonomických úrovních v závislosti na životním stylu jedince. Byl vytvořen nástroj klasifikující jednotlivé atributy, jako jsou stravovací návyky (vegetarián, vegan, všežravec), citlivost na lepek a laktózu, body mass index nebo věk či pohlaví, s využitím metod strojového učení. Při implementaci byly zvoleny metody k nejbližších sousedů (kNN), náhodný les (RF) a metoda podpůrných vektorů (SVM). Data pro natrénování klasifikátoru a vyhodnocení byla čerpána z projektu American Gut. Práce se rovněž zaobírá problémy spojenými s danými datovými sadami, jako je mnoharozměrnost, řídkost, jejich kompoziční závislost a nevyváženost.
metagenomika, taxonomie, OTU, predikce, klasifikace, strojové učení, k nejbližších sousedů, metoda podpůrných vektorů, náhodný les, T-test, analýza hlavních komponent, lineární diskriminační analýza
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na otázku přítomného člena. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dobře (C).
- V práci používáte algoritmus kNN. Zkoušel jste více metrik pro posouzení vzdálenosti mezi vzorky? Jak dobře by fungovala např. kosinova vzdálenost, resp. Pearsonova korelační vzdálenost?
- Zkoušel jste pro výběr rysů použít nějakou z již publikovaných metod? Např. LASSO?
- Jak si vysvětlujete, že algoritmus LDA byl schopen za daných podmínek oddělit třídy atributu diet_type? Dosáhl by natrénovaný model stejného výsledku i na dosud nepozorovaných datech?
Fuchs Petr, RNDr., Ph.D. (UMAT FEKT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Zbořil František V., doc. Ing., CSc. (UITS FIT VUT), člen
@bachelorsthesis{FITBT22114, author = "Jan Kubica", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "N\'{a}stroj pro predikci atribut\r{u} \v{z}ivotn\'{i}ho stylu na z\'{a}klad\v{e} metagenomick\'{y}ch dat z tlust\'{e}ho st\v{r}eva", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2019, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/22114/" }