Detail práce

Nástroj pro predikci atributů životního stylu na základě metagenomických dat z tlustého střeva

Bakalářská práce Student: Kubica Jan Akademický rok: 2018/2019 Vedoucí: Smatana Stanislav, Ing.
Název anglicky
Tool for Classification of Lifestyle Traits Based on Metagenomic Data from the Large Intestine
Jazyk práce
český
Abstrakt

Tato práce se zabývá analýzou lidského mikrobiomu na základě metagenomických dat z tlustého střeva. Předmětem zkoumání je zastoupení bakterií na různých taxonomických úrovních v závislosti na životním stylu jedince. Byl vytvořen nástroj klasifikující jednotlivé atributy, jako jsou stravovací návyky (vegetarián, vegan, všežravec), citlivost na lepek a laktózu, body mass index nebo věk či pohlaví, s využitím metod strojového učení. Při implementaci byly zvoleny metody k nejbližších sousedů (kNN), náhodný les (RF) a metoda podpůrných vektorů (SVM). Data pro natrénování klasifikátoru a vyhodnocení byla čerpána z projektu American Gut. Práce se rovněž zaobírá problémy spojenými s danými datovými sadami, jako je mnoharozměrnost, řídkost, jejich kompoziční závislost a nevyváženost.

Klíčová slova

metagenomika, taxonomie, OTU, predikce, klasifikace, strojové učení, k nejbližších sousedů, metoda podpůrných vektorů, náhodný les, T-test, analýza hlavních komponent, lineární diskriminační analýza

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
13. června 2019
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na otázku přítomného člena. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dobře (C).

Otázky u obhajoby
  1. V práci používáte algoritmus kNN. Zkoušel jste více metrik pro posouzení vzdálenosti mezi vzorky? Jak dobře by fungovala např. kosinova vzdálenost, resp. Pearsonova korelační vzdálenost?
  2. Zkoušel jste pro výběr rysů použít nějakou z již publikovaných metod? Např. LASSO?
  3. Jak si vysvětlujete, že algoritmus LDA byl schopen za daných podmínek oddělit třídy atributu diet_type? Dosáhl by natrénovaný model stejného výsledku i na dosud nepozorovaných datech?
Komise
Sekanina Lukáš, prof. Ing., Ph.D. (UPSY FIT VUT), předseda
Fuchs Petr, RNDr., Ph.D. (UMAT FEKT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Zbořil František V., doc. Ing., CSc. (UITS FIT VUT), člen
Citace
KUBICA, Jan. Nástroj pro predikci atributů životního stylu na základě metagenomických dat z tlustého střeva. Brno, 2019. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-13. Vedoucí práce Smatana Stanislav. Dostupné z: https://www.fit.vut.cz/study/thesis/22114/
BibTeX
@bachelorsthesis{FITBT22114,
    author = "Jan Kubica",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "N\'{a}stroj pro predikci atribut\r{u} \v{z}ivotn\'{i}ho stylu na z\'{a}klad\v{e} metagenomick\'{y}ch  dat z tlust\'{e}ho st\v{r}eva",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/22114/"
}
Nahoru