Optimalizace spouštěcích konfigurací k-Wave úloh

Název anglicky

Optimization of Run Configurations of k-Wave Jobs

Jazyk práce

český

Abstrakt

Táto práca sa zaoberá plánovaním, resp. správnym odhadom spúšťacích konfigurácií úloh k-Wave na superpočítačoch infraštruktúry IT4Innovations. Presnejšie pre klastre Salomon a Anselm. Úloha predstavuje množinu simulácií, kde každá simulácia je spúšťaná pod toolboxom k-Wave. Pre spustenie jednotlivých simulácií je nutné správne vytvoriť konfiguráciu, ktorá sa skladá z množstva zdrojov (počet výpočtových uzlov, resp. jadier) a času rezervácie superpočítača, čo je pre neskúseného zložité odhadnúť. Zvolený problém odhadu je riešený na základe empirických dát, ktoré boli získané viacnásobným spúšťaním rôznych množín simulácií na klastroch. Tieto dáta sú uložené a spracované aproximátormi, ktoré konkrétne vykonávajú odhad týchto parametrov na základe metód interpolácie a regresie. V práci je popísaný a bol implementovaný systém predstavujúci plánovač, ktorý predstavuje rozhranie pre odhad. Experimentovaním bolo zistené že pre tento špecifický problém najpresnejšie odhady vykonáva trojica Akima spline, PCHIP interpolácia a kubický spline. Výsledky tejto práce umožňujú vykonávať istý odhad exekučného času a počtu vlákien pre ľubovolné simulácie automaticky a bez znalosti kódu k-Wave.

Klíčová slova

superpočítač, plánovač, plánovanie, dáta, optimalizácia, k-wave, klaster, salomon, anselm, experiment, meranie, predikcia, it4i, simulácia, hpc, pbs, slurm, aproximácia, interpolácia, regresia, data-mining

Ústav

Ústav počítačových systémů FIT VUT v Brně

Studijní program

Informační technologie

Soubory

Stav

obhájeno, hodnocení A

Obhajoba

13. července 2020

Oponent

Jaroš Marta, Ing., PhD.

Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby

Můžete vysvětlit, proč v případech, kdy pro danou velikost úlohy existuje v databázi více měření, průměrujete výpočetní časy těchto měření? Proč nepočítáte třeba střední hodnotu?
Jak se plánuje úloha, pro kterou plánovač nemůže použít žádná historická data v databázi?
Mohl byste procentuálně vyjádřit, jak se liší naměřená data (výpočetní čas pro daný počet jader a velikost úlohy) od těch aproximovaných? Jak jsou od sebe body vzdáleny?
Jak byste vyhodnotil, který aproximátor je v daném případě nejvhodnější, aby plánování a spuštění úlohy mohlo probíhat automatizovaně?
Píšete, že by vaše aplikace mohla být v budoucnu používána nástrojem k-Dispatch. k-Dispatch je ale postaven na Pythonu 3.5. Je vaše aplikace zpětně kompatibilní, popř. jaké změny by bylo nutné implementovat?
Jste u uvedeného článku spoluautorem?

Komise

Sekanina Lukáš, prof. Ing., Ph.D. (UPSY FIT VUT), předseda
Beran Vítězslav, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen

Citace

SASÁK, Tomáš. Optimalizace spouštěcích konfigurací k-Wave úloh. Brno, 2020. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2020-07-13. Vedoucí práce Jaroš Jiří. Dostupné z: https://www.fit.vut.cz/study/thesis/21798/

BibTeX

@bachelorsthesis{FITBT21798,
    author = "Tom\'{a}\v{s} Sas\'{a}k",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Optimalizace spou\v{s}t\v{e}c\'{i}ch konfigurac\'{i} k-Wave \'{u}loh",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2020,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/21798/"
}