Detail práce

Využití variačních autoenkodérů pro ancestrální rekonstrukci sekvencí

Diplomová práce Student: Kohout Pavel Akademický rok: 2021/2022 Vedoucí: Musil Miloš, Ing., Ph.D.
Název anglicky
The Application of Variational Autoencoders for Ancestral Sequence Reconstruction
Jazyk práce
český
Abstrakt

Proteinové inženýrství je interdisciplinární vědní obor zabývající se návrhem vylepšených proteinů. Úspěšnou metodou využívanou pro návrh stabilnějších a aktivnějších proteinů je ancestrální rekonstrukce sekvencí. Tato metoda zkoumá evoluční vztahy mezi existujícími proteiny a za pomoci fylogenetických stromů vytváří jejich evoluční předchůdce, které kýžené vylepšené vlastnosti často vykazují. Proto nové a robustnější metody využívající matematické modely společně s obrovským množstvím sekvenčních dat by se mohly stát mocným nástrojem proteinového inženýrství. Tato diplomové práce se zabývá použitím variačních autoenkodérů jako alternativního přístupu k návrhu ancestrálních sekvencí oproti konvenčním metodám využívajícím fylogenetické stromy. V práci byly provedeny experimenty pro optimalizaci architektury a navrženy statistické metody pro evaluaci kvality modelů a generovaných sekvencí. Současně byly provedeny zkoušky robustnosti celé metody a navrhnuty a implementovány strategie pro generaci sekvence předků.

Klíčová slova

bioinformatika, strojové učení, generativní modely, variační autoenkodéry, proteinové inženýrství, ancestrální rekonstrukce, optimalizace proteinů

Ústav
Studijní program
Informační technologie a umělá inteligence, specializace Bioinformatika a biocomputing
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
21. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. Z textu mi nebylo zřejmé, zda mapování ASR sekvencí do latentního prostoru dopadlo dobře či nikoliv. Z obrázku 8.4 spíše plyne, že evoluční vztahy se v latentním prostoru nedaří vždy zachytit v dostatečné míře. Jak to tedy je?
  2. Jak úspěšná byla rekonstrukce trénovacích sekvencí z latentního prostoru zpět do sekvenčního? Do jaké míry může tato rekonstrukce ovlivnit kvalitu generovaných ASR sekvencí?
  3. Kolik trénovacích vzorků a jaké parametry enkodéru jsou obvyklé v úspěšných aplikacích této metody (např. v oblasti zpracování videa, zvuku)? Odpovídá to parametrům úloh v oblasti proteinového inženýrství?
Komise
Sekanina Lukáš, prof. Ing., Ph.D. (UPSY FIT VUT), předseda
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Burgetová Ivana, Ing., Ph.D. (UIFS FIT VUT), člen
Lengál Ondřej, Ing., Ph.D. (UITS FIT VUT), člen
Matoušek Radomil, doc. Ing., Ph.D. (ÚAI FSI VUT), člen
Vašíček Zdeněk, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Citace
KOHOUT, Pavel. Využití variačních autoenkodérů pro ancestrální rekonstrukci sekvencí. Brno, 2022. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-21. Vedoucí práce Musil Miloš. Dostupné z: https://www.fit.vut.cz/study/thesis/24721/
BibTeX
@mastersthesis{FITMT24721,
    author = "Pavel Kohout",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Vyu\v{z}it\'{i} varia\v{c}n\'{i}ch autoenkod\'{e}r\r{u} pro ancestr\'{a}ln\'{i} rekonstrukci sekvenc\'{i}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/24721/"
}
Nahoru