Detail práce

Návrh a optimalizace obrazových klasifikátorů

Disertační práce Student: Kadlček Filip Akademický rok: 2016/2017 Vedoucí: Fučík Otto, doc. Dr. Ing.
Název anglicky
Design and optimisation of image classifiers
Jazyk práce
český
Abstrakt

Detekce objektů je velmi důležitou operací v systémech zpracovávajících obrazová data, jako jsou například různé dohledové nebo bezpečnostní systémy. Tato úloha je výpočetně velmi náročná a konzumuje velké množství výpočetních zdrojů. Detekce se provádí například pomocí obrazových klasifikátorů. S vývojem nových obrazových snímačů, a s tím spojeným stoupajícím datovým tokem z nich, rostou požadavky na výpočetní prostředky, a klasifikaci je tak třeba provádět velmi rychle a efektivně. Disertační práce se proto zaměřuje na obrazové klasifikátory, optimalizaci jejich běhu, tvorby a využití FPGA technologie pro jejich implementaci. V práci jsou využity klasifikátory založené na obecné klasifikační metodě AdaBoost, pomocí které je možné detekovat různé typy objektů. AdaBoost patří do skupiny boostingových metod, které jsou založeny na kombinaci výsledků mnoha slabých klasifikátorů pro získání konečného výsledku. V této práci se pro vytváření slabých klasifikátorů využívá jednoduchých binárních obrazových operátorů - Local Binary Pattern, které mají dobrou diskriminativní sílu a jsou vhodné pro FPGA technologii. Jedním z cílů této práce je prokázat, že použití aplikačně specifického přístupu vede k lepším výsledkům z hlediska rychlosti a efektivity výpočtu, než při použití obecných klasifikátorů. Splnění tohoto cíle je rozděleno na několik částí, z nichž první je přizpůsobení tvaru obrazových operátorů pro aktuálně řešenou úlohu. Pro řešení této problematiky byl v práci zvolen genetický algoritmus. Pomocí něj jsou navrženy nové aplikačně specifické tvary příznaků a je dosaženo zpřesnění klasifikace až o 4 %. Předností nově navržených příznaků je, že jejich klasifikační výkonnost je optimalizována vzhledem k aktuální aplikační úloze. Hlavní přínos této práce však spočívá v představení multiparalelního detektoru objektů pracujícího v reálném čase - RT-MPOD. Ten je založen na vícenásobné aplikaci vyhodnocovací jednotky AdaBoost - AC, která využívá neseřazeného vyhodnocení slabých klasifikátorů pro dosažení plně paralelního běhu. AC jednotka vyhodnotí jedno detekční okno v každém hodinovém cyklu. RT-MPOD dosahuje velmi vysoké rychlosti zpracování dat - jeden pixel za jeden hodinový cyklus a může zpracovávat obrazový tok až s 300 megapixely za sekundu (to je například obraz o rozlišení 3000 x 2000 pixelů a 50 snímků za sekundu), což je téměř o řád více než doposud představené architektury. Vysoké rychlosti zpracování je dosaženo díky několika technikám použitých v práci. První technikou je využití několikanásobného paralelizmu při zpracování obrazu. Druhou technikou je využití aplikačně specifické implementace klasifikátoru pro každou z použitých AC jednotek. Každý klasifikátor je tak maximálně přizpůsoben aktuální úloze. Vyvinutá AC jednotka a také celá RT-MPOD jsou specifické svým proudovým charakterem zpracování dat, což znamená, že se již ke zpracovaným datům nevrací a není třeba dodatečných vyrovnávacích pamětí. Jelikož je každá z částí klasifikátoru silně aplikačně specifická, byla pro pohodlnou práci navržena metoda automatizovaného sestavení klasifikátoru na základě definovaných požadavků. Návrhář poté pracuje s nástrojem na vysoké úrovni abstrakce a je mu dána možnost určit parametry řešení, jako jsou například přesnost výsledného klasifikátoru, parametry cílového FPGA, data pro trénování, datová propustnost a podobně. RT-MPOD je také navržen s ohledem na jednoduché rozdělení do více výpočetních architektur tak, aby jej bylo možné použít například jako předzpracovávající jednotku pro provádění předvýběru zájmových objektů.

Klíčová slova

AdaBoost, zpracování v reálném čase, klasifikace, RT-MPOD, Local Binary Pattern, genetický algoritmus.

Ústav
Studijní program
Výpočetní technika a informatika, obor Výpočetní technika a informatika
Soubory
Stav
obhájeno
Obhajoba
28. dubna 2017
Citace
KADLČEK, Filip. Návrh a optimalizace obrazových klasifikátorů. Brno, 2016. Disertační práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2017-04-28. Vedoucí práce Fučík Otto. Dostupné z: https://www.fit.vut.cz/study/phd-thesis/565/
BibTeX
@phdthesis{FITPT565,
    author = "Filip Kadl\v{c}ek",
    type = "Diserta\v{c}n\'{i} pr\'{a}ce",
    title = "N\'{a}vrh a optimalizace obrazov\'{y}ch klasifik\'{a}tor\r{u}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2017,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/phd-thesis/565/"
}
Nahoru