Detail práce

Hluboké neuronové sítě pro posilované učení

Bakalářská práce Student: Ludvík Tomáš Akademický rok: 2021/2022 Vedoucí: Hradiš Michal, Ing., Ph.D.

Název anglicky

Deep Neural Networks for Reinforcement Learning

Jazyk práce

český

Abstrakt

Cílem této práce je použití hlubokých neuronových sítí na problém v posilovaném učení. Používám moji úpravu 2D hry Tuxánci jako testovací prostředí. Jedná se o úpravu, která zajišťuje možnosti využití hry jako prostředí pro strojového učení. Následně řeším problémy s naučením agenta pomocí posilovaného učení algoritmem Double DQN. Pomocí experimentů si prokazuji správné nastavení funkce odměn.

Klíčová slova

Posilované učení, DQN, Tuxánci, Tensorflow, strojové učení, testovací prostředí

Ústav

Ústav počítačové grafiky a multimédií FIT VUT v Brně

Studijní program

Informační technologie

Soubory

Stav

obhájeno, hodnocení C

Obhajoba

14. června 2022

Oponent

Bambušek Daniel, Ing.

Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Otázky u obhajoby

Je používáno perfektní nebo limitované pozorování?
Jakým způsobem se agent učí?

Komise

Čadík Martin, doc. Ing., Ph.D. (UPGM FIT VUT), předseda
Bařina David, Ing., Ph.D. (UPGM FIT VUT), člen
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Mrázek Vojtěch, Ing., Ph.D. (UPSY FIT VUT), člen

Citace

LUDVÍK, Tomáš. Hluboké neuronové sítě pro posilované učení. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-14. Vedoucí práce Hradiš Michal. Dostupné z: https://www.fit.vut.cz/study/thesis/24975/

BibTeX

@bachelorsthesis{FITBT24975,
    author = "Tom\'{a}\v{s} Ludv\'{i}k",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Hlubok\'{e} neuronov\'{e} s\'{i}t\v{e} pro posilovan\'{e} u\v{c}en\'{i}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/24975/"
}

Závěrečné práce