Detail publikace
Fast Linear Algebra on GPU
GPU jsou úspěšně využívané k akceleraci mnoha matematických funkcí a knihoven. Běžnou limitací těchto knihoven je minimální velikost problému, nutná k dosažení podstatného zrychlení, v porovnání s CPU ekvivalentem. Toto kritérium může pro mnoho aplikací znamenat nemožnost jejich implementace na GPU. Je však možné jej obejít pomocí slučování operací do dávek tak, aby GPU mělo dostatek dat k efektivnímu zpracování. V této publikaci navrhujeme rychlou OpenCL implementaci dvou základních vektorových funkcí - redukci a násobení skalárem. Rychlost implementace byla změřena na dvou dnes nejpoužívanějších typech GPU (Tesla a Fermi). V porovnání s dnešním de-facto standardem, knihovnou CUBLAS, je naše implementace výrazně rychlejší.
@INPROCEEDINGS{FITPUB10039, author = "Luk\'{a}\v{s} Polok and Pavel Smr\v{z}", title = "Fast Linear Algebra on GPU", pages = 6, booktitle = "IEEE conference proceedings", year = 2012, location = "Liverpool, GB", publisher = "IEEE Computer Society", ISBN = "978-0-7695-4749-7", language = "english", url = "https://www.fit.vut.cz/research/publication/10039" }