Detail výsledku

Cache Efficient Implementation for Block Matrix Operations

POLOK, L.; ILA, V.; SMRŽ, P. Cache Efficient Implementation for Block Matrix Operations. Proceedings of the 21st High Performance Computing Symposium (HPC'13). San Diego: Association for Computing Machinery, 2013. p. 698-706. ISBN: 1-56555-350-0.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Polok Lukáš, Ing., Ph.D., UPGM (FIT)
Ila Viorela Simona, Ph.D., UPGM (FIT)
Smrž Pavel, doc. RNDr., Ph.D., UPGM (FIT)
Abstrakt

Efficiently manipulating and operating on block matrices can be beneficial in many applications, among others those involving iteratively solving nonlinear systems. These types of problems consist of repeatedly assembling and solving sparse linear systems. In the case of very large systems, without a careful manipulation of the corresponding matrices, solving can become very time consuming.

This paper proposes a memory storage scheme convenient for both, numeric and structural matrix modification and, at the same time, allowing efficient arithmetic operation. This scheme was used in the implementation of a simple BLAS-like library. The advantage of the new scheme is demonstrated through exhaustive tests on the popular University of Florida Sparse Matrix Collection. Furthermore, this library was used in solving several nonlinear graph optimization problems.

Klíčová slova

block matrix, high performance, sparse BLAS, nonlinear least squares

URL
Anotace

Tento článek se zabývá efektivní implementací operací nad řídkými blokovými maticemi na CPU, pomocí efektivního návrhu struktur pro uložení matic v paměti a pomocí agresivní optimalizace pomocí instrukčních sad SSE, AltiVec nebo NEON.

Dosahuje se velmi dobrých výsledků, jak s implementací samotnou, tak s jejím využití při řešení robotických problémů typu nonlinear least squares.

Rok
2013
Strany
698–706
Sborník
Proceedings of the 21st High Performance Computing Symposium (HPC'13)
Konference
21st High Performance Computing Symposium
ISBN
1-56555-350-0
Vydavatel
Association for Computing Machinery
Místo
San Diego
BibTeX
@inproceedings{BUT103462,
  author="Lukáš {Polok} and Viorela Simona {Ila} and Pavel {Smrž}",
  title="Cache Efficient Implementation for Block Matrix Operations",
  booktitle="Proceedings of the 21st High Performance Computing Symposium (HPC'13)",
  year="2013",
  pages="698--706",
  publisher="Association for Computing Machinery",
  address="San Diego",
  isbn="1-56555-350-0",
  url="http://dl.acm.org/citation.cfm?id=2499972"
}
Soubory
Projekty
Centrum excelence IT4Innovations, MŠMT, Operační program Výzkum a vývoj pro inovace, ED1.1.00/02.0070, zahájení: 2011-01-01, ukončení: 2015-12-31, ukončen
IMPART - Intelligent Management Platform for Advanced Real-Time media processes, MŠMT, Sedmý rámcový program Evropského společenství pro atomovou energii (Euratom) v oblasti jaderného výzkumu a vzdělávání, 7E13044, zahájení: 2012-11-01, ukončení: 2015-10-31, ukončen
Národní dofinancování projektu Robust & Safe Mobile Co-operative Autonomous Systems, MŠMT, Společné technologické iniciativy, 7H10011, zahájení: 2010-04-01, ukončení: 2013-04-30, řešení
Výzkumné skupiny
Pracoviště
Nahoru