Detail publikace
Inference Energy Analysis in Context of Hardware-Aware NAS
Klhůfek Jan, Ing. (UPSY)
Mrázek Vojtěch, Ing., Ph.D. (UPSY)
Sekanina Lukáš, prof. Ing., Ph.D. (UPSY)
Quantization,Estimation,Energy measurement,Neural architecture
search,Convolutional neural networks,Hardware acceleration
Metody vyhledávání neuronové architektury s ohledem na hardware (HW-aware NAS)
jsou klíčové pro návrh a optimalizaci hlubokých neuronových sítí (DNN) pro
efektivní nasazení na hardwarových akcelerátorech.
V této práci analyzujeme dvě HW-aware NAS metody, EvoApproxNAS a ApproxDARTS,
a zkoumáme vliv přesného měření hardwarových parametrů (např. energie) pomocí
Timeloop na jejich výkon.
Zejména porovnáváme tento přístup přesného měření s původním přístupem používaným
v systémech EvoApproxNAS a ApproxDARTS, který se spoléhal na jednoduchý
analytický odhad energie založený na počtu násobení provedených během inferenční
fáze konvoluční neuronové sítě (CNN). Naše analýza ukazuje, jak vylepšené měření
energie zlepšuje proces vyhledávání metod NAS s ohledem na HW, což vede
k energeticky účinnějším architekturám.
Dále zdůrazňujeme důležitost přesného měření hardwarových parametrů a ukazujeme,
že přesné modelování hardwaru je rozhodující pro získání CNN s dobrým kompromisem
mezi přesností a energií. Naše výsledky ukazují, že bez přesného měření
hardwarových parametrů může HW-aware NAS přinést přijatelné výsledky, ale nemusí
plně využít potenciál hardwarového akcelerátoru, zejména pokud se uvažují
8xN-bitové přibližné násobiče, což v konečném důsledku omezuje účinnost
navržených architektur.
@inproceedings{BUT196475,
author="Michal {Piňos} and Jan {Klhůfek} and Vojtěch {Mrázek} and Lukáš {Sekanina}",
title="Inference Energy Analysis in Context of Hardware-Aware NAS",
booktitle="2025 28th International Symposium on Design and Diagnostics of Electronic Circuits and Systems",
year="2025",
pages="161--164",
publisher="Institute of Electrical and Electronics Engineers",
address="Lyon",
doi="10.1109/DDECS63720.2025.11006674",
isbn="979-8-3315-2801-0"
}