Detail práce
Využití variačních autoenkodérů pro ancestrální rekonstrukci sekvencí
Proteinové inženýrství je interdisciplinární vědní obor zabývající se návrhem vylepšených proteinů. Úspěšnou metodou využívanou pro návrh stabilnějších a aktivnějších proteinů je ancestrální rekonstrukce sekvencí. Tato metoda zkoumá evoluční vztahy mezi existujícími proteiny a za pomoci fylogenetických stromů vytváří jejich evoluční předchůdce, které kýžené vylepšené vlastnosti často vykazují. Proto nové a robustnější metody využívající matematické modely společně s obrovským množstvím sekvenčních dat by se mohly stát mocným nástrojem proteinového inženýrství. Tato diplomové práce se zabývá použitím variačních autoenkodérů jako alternativního přístupu k návrhu ancestrálních sekvencí oproti konvenčním metodám využívajícím fylogenetické stromy. V práci byly provedeny experimenty pro optimalizaci architektury a navrženy statistické metody pro evaluaci kvality modelů a generovaných sekvencí. Současně byly provedeny zkoušky robustnosti celé metody a navrhnuty a implementovány strategie pro generaci sekvence předků.
bioinformatika, strojové učení, generativní modely, variační autoenkodéry, proteinové inženýrství, ancestrální rekonstrukce, optimalizace proteinů
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Z textu mi nebylo zřejmé, zda mapování ASR sekvencí do latentního prostoru dopadlo dobře či nikoliv. Z obrázku 8.4 spíše plyne, že evoluční vztahy se v latentním prostoru nedaří vždy zachytit v dostatečné míře. Jak to tedy je?
- Jak úspěšná byla rekonstrukce trénovacích sekvencí z latentního prostoru zpět do sekvenčního? Do jaké míry může tato rekonstrukce ovlivnit kvalitu generovaných ASR sekvencí?
- Kolik trénovacích vzorků a jaké parametry enkodéru jsou obvyklé v úspěšných aplikacích této metody (např. v oblasti zpracování videa, zvuku)? Odpovídá to parametrům úloh v oblasti proteinového inženýrství?
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Burgetová Ivana, Ing., Ph.D. (UIFS FIT VUT), člen
Lengál Ondřej, Ing., Ph.D. (UITS FIT VUT), člen
Matoušek Radomil, doc. Ing., Ph.D. (ÚAI FSI VUT), člen
Vašíček Zdeněk, doc. Ing., Ph.D. (UPSY FIT VUT), člen
@mastersthesis{FITMT24721, author = "Pavel Kohout", type = "Diplomov\'{a} pr\'{a}ce", title = "Vyu\v{z}it\'{i} varia\v{c}n\'{i}ch autoenkod\'{e}r\r{u} pro ancestr\'{a}ln\'{i} rekonstrukci sekvenc\'{i}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2022, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/24721/" }