Detail práce

Posilované učení pro hraní robotického fotbalu

Bakalářská práce Student: Brychta Adam Akademický rok: 2019/2020 Vedoucí: Smrž Pavel, doc. RNDr., Ph.D.
Název anglicky
Reinforcement Learning for Robotic Soccer Playing
Jazyk práce
český
Abstrakt

Tato práce se zabývá vytvořením agenta pro hraní robotického fotbalu. V práci používám metodu hlubokého Q-učení, která využívá hlubokou neuronovou síť. Praktická část práce se zabývá implementací agenta pro posilované učení. Cílem agenta je vybrat nejlepší akci pro daný stav prostředí. Trénování agenta probíhá v různých scénářích situací na hřišti. Výsledek této práce ukazuje přístup k hraní fotbalu pomocí strojového učení.

Klíčová slova

posilované učení, posilované učení pro hraní fotbalu, Q-učení, hluboké Q-učení, dvojité hluboké Q-učení

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
13. července 2020
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Otázky u obhajoby
  1. Jsou akce v rozhraní Simple Football Environment namapovány 1:1 pro Google Football? Jak složité je rozhraní rozšířit na RoboCup?
  2. Jak jste dospěl ve funkci odměny ke koeficientům značícím jednotlivé odměny pro akce?
  3. Uvažoval jste o zkombinování zmíněných třech funkcí odměny?
  4. V jakém složení hrají týmy v testovacích scénářích? Kolik je hráčů na hřišti?
  5. Obsahuje váš agent stavy?
  6. Proč vaše experimenty končí před "konvergencí"? Je to úmyslně? Jak jste porovnával vašeho agenta s ostatními?
Komise
Zbořil František, doc. Ing., Ph.D. (UITS FIT VUT), předseda
Grégr Matěj, Ing., Ph.D. (UIFS FIT VUT), člen
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Kekely Lukáš, Ing., Ph.D. (UPSY FIT VUT), člen
Rogalewicz Adam, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Citace
BRYCHTA, Adam. Posilované učení pro hraní robotického fotbalu. Brno, 2020. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2020-07-13. Vedoucí práce Smrž Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/22795/
BibTeX
@bachelorsthesis{FITBT22795,
    author = "Adam Brychta",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Posilovan\'{e} u\v{c}en\'{i} pro hran\'{i} robotick\'{e}ho fotbalu",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2020,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/22795/"
}
Nahoru