Detail práce

Hluboké neuronové sítě pro posilované učení

Bakalářská práce Student: Ludvík Tomáš Akademický rok: 2021/2022 Vedoucí: Hradiš Michal, Ing., Ph.D.
Název anglicky
Deep Neural Networks for Reinforcement Learning
Jazyk práce
český
Abstrakt

Cílem této práce je použití hlubokých neuronových sítí na problém v posilovaném učení. Používám moji úpravu 2D hry Tuxánci jako testovací prostředí. Jedná se o úpravu, která zajišťuje možnosti využití hry jako prostředí pro strojového učení. Následně řeším problémy s naučením agenta pomocí posilovaného učení algoritmem Double DQN. Pomocí experimentů si prokazuji správné nastavení funkce odměn. 

Klíčová slova

Posilované učení, DQN, Tuxánci, Tensorflow, strojové učení, testovací prostředí

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
14. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Otázky u obhajoby
  1. Je používáno perfektní nebo limitované pozorování?
  2. Jakým způsobem se agent učí?
Komise
Čadík Martin, doc. Ing., Ph.D. (UPGM FIT VUT), předseda
Bařina David, Ing., Ph.D. (UPGM FIT VUT), člen
Burget Radek, doc. Ing., Ph.D. (UIFS FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Mrázek Vojtěch, Ing., Ph.D. (UPSY FIT VUT), člen
Citace
LUDVÍK, Tomáš. Hluboké neuronové sítě pro posilované učení. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-14. Vedoucí práce Hradiš Michal. Dostupné z: https://www.fit.vut.cz/study/thesis/24975/
BibTeX
@bachelorsthesis{FITBT24975,
    author = "Tom\'{a}\v{s} Ludv\'{i}k",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Hlubok\'{e} neuronov\'{e} s\'{i}t\v{e} pro posilovan\'{e} u\v{c}en\'{i}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/24975/"
}
Nahoru