Detail předmětu

Architektury počítačů

ARP Ak. rok 2005/2006 zimní semestr 6 kreditů

Aktuální akademický rok

Předmět pokrývá architekturu procesorů a paralelních systémů. Paralelismus na úrovni instrukcí (ILP) a vláken (TLP) je studován na procesorech skalárních, superskalárních, VLIW a multivláknových. Dále v kontextu paralelismu procesů je pojednáno o nejrozšířenějších symetrických multiprocesorech se společnou sběrnicí (SMP). Následuje výklad propojovacích sítí jako základ systémů s distribuovanou sdílenou pamětí (NUMA) a multipočítačů s lokálními pamětmi, zejména populárních svazků pracovních stanic a masivně paralelních systémů. V poslední skupině jsou paralelní vektorové procesory a zpracování stylem SIMD (datový paralelismus).

Garant předmětu

Jazyk výuky

český

Zakončení

zápočet+zkouška (písemná)

Rozsah

39 hod. přednášky, 16 hod. cvičení, 10 hod. projekty

Bodové hodnocení

60 zkouška, 10 půlsemestrální test, 30 projekty

Zajišťuje ústav

Přednášející

Cvičící

Získané dovednosti, znalosti a kompetence z předmětu

Přehled mikroarchitektury procesorů a jejich trendů, principů výstavby paralelních systémů a propojovacích sítí, schopnost odhadnout výkonnost paralelních aplikací.

Cíle předmětu

Seznámit se s architekturou nejnovějších procesorů pracujících s paralelismem na úrovni instrukcí a jejím dopadem na návrh překladačů. Pochopit problematiku paralelních systémů využívajících funkční paralelismus na úrovni procesů nebo vláken a rovněž datový paralelismus.

Požadované prerekvizitní znalosti a dovednosti

Architektura počítače typu von Neumann, hierarchické uspořádání paměťového systému, vyrovnávací paměti a jejich organizace, programování v JSI a v C/C++, činnost a funkce kompilátoru

Literatura studijní

 • Dvořák, V., Drábek, V.: Architektura procesorů. VUTIUM, Brno, 1999, 330 s., ISBN 80-214-1458-8. 
 • Dvořák, V.: Architektura a programování paralelních systémů. Skriptum FIT VUT v Brně, 2004, 170 s., ISBN 80-214-2608-X.  

Literatura referenční

 • Culler, D.E. et al.: Parallel Computer Architecture. Morgan Kaufmann Publishers, 1999, 1025 s., ISBN 1-55860-343-3. 
 • Hennessy, J.L., Patterson, D.A.: Computer Architecture - A Quantitative Approach. 3. vydání, Morgan Kaufman Publishers, Inc., 2003, 1136 p., ISBN 1-55860-596-7.  

Osnova přednášek

 • Funkční a datový paralelismus, ukazatele výkonnosti, zákony omezující zrychlení.
 • Zřetězené zpracování instrukcí a instrukční závislosti. Architektura typického procesoru DLX.
 • Konflikty datové, řídící, strukturní, techniky snižování prostojů linky s asistencí hardware i kompilátoru. Paralelismus u smyček, predikce skoků.
 • Superskalární CPU. Dynamické plánování instrukcí, přejmenování registrů, ROB, spekulace.
 • Volnější modely konzistence paměti. Procesory VLIW. Programové řetězení, predikace.
 • Paralelismus na úrovni vláken, podpora v hardware. Multivláknové procesory, SMT.
 • Architektury se sdílenou pamětí. Saturace sběrnice, organizace paměti, koherence pamětí cache.
 • Protokoly koherence MSI a MESI. Synchronizace událostí v multiprocesorech.
 • Propojovací a přepínací sítě. Vlastnosti a parametry, směrování, řízení, kolektivní komunikace.
 • Architektury s distribuovanou sdílenou pamětí, sdílená virtuální paměť.
 • Architektury se zasíláním zpráv. Podpora komunikace v hardware, překrytí komunikace a výpočtů.
 • Datový paralelismus, vektorové procesory a instrukce. Počítače SIMD a zpracování stylem SIMD. Systolické struktury.
 • Akcelerátory a specifické architektury pro ANN, architektury budoucích procesorů.

Osnova numerických cvičení

 • Účinnost a zrychlení paralelních aplikací, Amdahlův a Gustafsonův zákon.
 • Instrukční závislosti a eliminace konfliktů při řetězovém zpracování, rozbalování smyček.
 • Superskalární zpracování.
 • Půlsemestrální zkouška.
 • VLIW a softwarové řetězení.
 • Multivláknové zpracování, SMT.
 • Sdílená paměť, škálovatelnost sběrnice,výkonnost systémů se sdílenou pamětí.
 • Parametry propojovacích sítí, směrovací algoritmy.
 • Vektorové procesory, trvání vektorových operací.

Osnova laboratorních cvičení

 • Řetězené zpracování instrukcí v procesoru DLX. (WinDLX)
 • Saturace sběrnice multiprocesoru se sdílenou pamětí a sběrnicí.
 • Paralelní transpozice matice na svazku pracovních stanic.
 • Mocnina matice linkou procesorů se SW řetězením.

Průběžná kontrola studia

Vyhodnocení čtyř malých projektů, půlsemestrální zkouška.
Minimální počet bodů: 20

Podmínky zápočtu

Zařazení předmětu ve studijních plánech

Nahoru