Detail práce

Posilované učení pro hru typu Bomberman

Bakalářská práce Student: Adamčiak Jakub Akademický rok: 2021/2022 Vedoucí: Hradiš Michal, Ing., Ph.D.
Název anglicky
Reinforcement Learning for Bomberman Type Game
Jazyk práce
český
Abstrakt

Cieľom tejto bakalárksej práce je návrh, implementácia a trénovanie modelov posilňovaného učenia na hru typu Bomberman. Je postavená na prostredí Bomberland od firmy CoderOne. Toto prostredie bolo vyvinuté za účelom vzdelávania a výskumu v odvetí umelej inteligencie. V tejto práci rozoberám rôzne nastavenia a problémy s implementovaním agenta do prostredia. Vyskúšal som 2 politiky (MLP a CNN), 2 algoritmy (PPO a A2C) a 5 druhov neurónových sietí pre extrakciu vlastností za pomoci knižníc stable baselines 3 a pytorch. Celkový čas trénovania týchto modelov bol dokopy 1207 reálnych hodín, 4168 strojových hodín a 271 miliónov herných krokov. Aj keď bolo trénovanie neúspešné, táto práca ukazuje proces implementácie modelu posilňovaného učenia do prostredia Gym.

Klíčová slova

umelá inteligencia, AI, strojové učenie, ML, posilované učenie, RL, konvolučné neurónové siete, CNN, PPO, A2C, python, stable baselines3, ai-gym, pytorch, hry, bomberman

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
16. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Otázky u obhajoby
  1. Jaké by bylo nastavení toho nejjednoduššího prostředí, metod, jejich parametrů, abyste ověřil funkčnost systému a schopnosti úspěšného naučení agenta?
  2. Kde vidíte klíčové problémy ve Vašem postupu, že se Vám nepodařilo natrénovat úspěšného agenta?
  3. Co vás vedlo k výběru prostředí, které jste použil?
Komise
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT), předseda
Burgetová Ivana, Ing., Ph.D. (UIFS FIT VUT), člen
Kreslíková Jitka, doc. RNDr., CSc. (UIFS FIT VUT), člen
Smrčka Aleš, Ing., Ph.D. (UITS FIT VUT), člen
Strnadel Josef, Ing., Ph.D. (UPSY FIT VUT), člen
Citace
ADAMČIAK, Jakub. Posilované učení pro hru typu Bomberman. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-16. Vedoucí práce Hradiš Michal. Dostupné z: https://www.fit.vut.cz/study/thesis/25173/
BibTeX
@bachelorsthesis{FITBT25173,
    author = "Jakub Adam\v{c}iak",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Posilovan\'{e} u\v{c}en\'{i} pro hru typu Bomberman",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/25173/"
}
Nahoru