Detail práce
Optimalizace spouštěcích konfigurací k-Wave úloh
Táto práca sa zaoberá plánovaním, resp. správnym odhadom spúšťacích konfigurácií úloh k-Wave na superpočítačoch infraštruktúry IT4Innovations. Presnejšie pre klastre Salomon a Anselm. Úloha predstavuje množinu simulácií, kde každá simulácia je spúšťaná pod toolboxom k-Wave. Pre spustenie jednotlivých simulácií je nutné správne vytvoriť konfiguráciu, ktorá sa skladá z množstva zdrojov (počet výpočtových uzlov, resp. jadier) a času rezervácie superpočítača, čo je pre neskúseného zložité odhadnúť. Zvolený problém odhadu je riešený na základe empirických dát, ktoré boli získané viacnásobným spúšťaním rôznych množín simulácií na klastroch. Tieto dáta sú uložené a spracované aproximátormi, ktoré konkrétne vykonávajú odhad týchto parametrov na základe metód interpolácie a regresie. V práci je popísaný a bol implementovaný systém predstavujúci plánovač, ktorý predstavuje rozhranie pre odhad. Experimentovaním bolo zistené že pre tento špecifický problém najpresnejšie odhady vykonáva trojica Akima spline, PCHIP interpolácia a kubický spline. Výsledky tejto práce umožňujú vykonávať istý odhad exekučného času a počtu vlákien pre ľubovolné simulácie automaticky a bez znalosti kódu k-Wave.
superpočítač, plánovač, plánovanie, dáta, optimalizácia, k-wave, klaster, salomon, anselm, experiment, meranie, predikcia, it4i, simulácia, hpc, pbs, slurm, aproximácia, interpolácia, regresia, data-mining
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Můžete vysvětlit, proč v případech, kdy pro danou velikost úlohy existuje v databázi více měření, průměrujete výpočetní časy těchto měření? Proč nepočítáte třeba střední hodnotu?
- Jak se plánuje úloha, pro kterou plánovač nemůže použít žádná historická data v databázi?
- Mohl byste procentuálně vyjádřit, jak se liší naměřená data (výpočetní čas pro daný počet jader a velikost úlohy) od těch aproximovaných? Jak jsou od sebe body vzdáleny?
- Jak byste vyhodnotil, který aproximátor je v daném případě nejvhodnější, aby plánování a spuštění úlohy mohlo probíhat automatizovaně?
- Píšete, že by vaše aplikace mohla být v budoucnu používána nástrojem k-Dispatch. k-Dispatch je ale postaven na Pythonu 3.5. Je vaše aplikace zpětně kompatibilní, popř. jaké změny by bylo nutné implementovat?
- Jste u uvedeného článku spoluautorem?
Beran Vítězslav, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT21798, author = "Tom\'{a}\v{s} Sas\'{a}k", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Optimalizace spou\v{s}t\v{e}c\'{i}ch konfigurac\'{i} k-Wave \'{u}loh", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2020, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/21798/" }