Camera Orientation Estimation in Natural Scenes Using Semantic Cues

Název česky

Odhad orientace kamery v přírodních scénách s využitím sémantické segmentace

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Brejcha Jan, Ing., Ph.D. (VZ CPHOTO)
Čadík Martin, doc. Ing., Ph.D. (UPGM)

URL

https://ieeexplore.ieee.org/document/8490971 HTML

Klíčová slova

camera orientation estimation, camera calibration, semantic segmentation, digital elevation model of a terrain, OpenStreetMap, geo-localization, computer vision, computer graphics

Abstrakt

Pro odhad orientace kamery v přírodních scénách bylo v poslední době vyvinuto několik metod, které využívají k registraci obrazu vůči 3D digitálnímu terénnímu modelu jednu modalitu - hrany, či křivky horizontu. Na rozdíl od předcházejících prací, naše nové schéma pro porovnávání obrázku a modelu je založeno na slučování více modalit a je navrženo tak, aby bylo snadno rozšiřitelné o nové příznaky. V tomto článku využíváme sémantickou segmentaci a hrany. Podle našeho názoru jsme první, kdo využívá sémantické segmenty společně s hranami pro zarovnávání obrazu s digitálním terénním modelem. Náš výzkum ukazuje, že vysokoúrovňové příznaky, jakými jsou sémantické segmenty, doplňují nízkoúrovňovou informaci obsaženou v hranách a dohromady pomáhají odhadovat orientaci kamery robustněji, než metody, které jsou založeny na porovnávání pouhých hran nebo křivek horizontu. V sérii experimentů ukazujeme, že hranice sémantických segmentů jsou většinou nepřesné a důležité informace jsou obsaženy v oblasti segmentu a jeho hrubém tvaru. Sémantické segmenty nesou nízkofrekvenční informaci na rozdíl od hran, které obsahují vysoké frekvence. Naše experimenty ukazují, že sémantické segmenty a hrany se navzájem doplňují a zajišťují zvýšení spolehlivosti odhadu kamery, pokud jsou použity společně. Dále ukazujeme, že naše metoda kombinující sémantické a hranové příznaky je schopna dosáhnout na třech různých datových sadách lepších výsledků, než dosahují metody současného stavu poznání.

Anotace

Představujeme novou metodu pro automatický odhad orientace kamery za předpokladu, že pozice kamery a úhel záběru je znám. Naše metoda zahrnuje následující kroky: (I) ze vstupního obrazu je automaticky detekována hranová mapa a sémantická segmentace popisující sémantické oblasti obrazu, jako jsou lesy, vodní plochy, obloha nebo ledovce; (II) v místě předpokládané pozice kamery je vyrenderováno 360 stupňové panorama obsahující sémantické segmenty z databáze OpenStreetMap a siluetní hrany z digitálního elevačního modelu; (III) detekované a renderované sémantické segmenty a hranové mapy jsou porovnávány mezi sebou pomocí sférické korelace a našeho nového schématu pro fúzi jistotních map (Confidence Fusion - CF), jejímž výsledkem je odhadovaná orientace kamery. Sférická korelace je spočtena pro každou sémantickou třídu a hranové mapy zvlášť tak, že jejím výsledkem je jistotní mapa určující jistotu pro každou uvažovanou orientaci. Jistotní mapy jsou sloučeny do jedné pomocí váženého geometrického průměru. Výsledná jistotní mapa určí odhadovanou orientaci kamery.

Naše metoda je vhodná pro odhad orientace kamery ve venkovním prostředí a může být využita v mnoha aplikacích. Aplikace zahrnují virtuální a rozšířenou realitu, vizualizace historické re-fotografie, navigaci, aj. Experimenty na třech různých, veřejně dostupných datových sadách ukázaly, že naše metoda dosahuje výsledků srovnatelných se současným stavem poznání.

Tato publikace byla prezentována na mezinárodní konferenci o 3D vidění (3DV) 2018 v italské Veroně a je veřejně dostupná: https://ieeexplore.ieee.org/document/8490971. Doprovodné materiály a video shrnující tuto publikaci je dostupné na webové stránce projektu: http://cphoto.fit.vutbr.cz/semantic-orientation/.

Rok

2018

Strany

208–217

Sborník

2018 International Conference on 3D Vision

Konference

3 DV konference, Verona, IT

ISBN

978-1-5386-2610-8

Vydavatel

IEEE Computer Society

Místo

Verona

DOI

10.1109/3DV.2018.00033

UT WoS

000449774200022

EID Scopus

2-s2.0-85056789707

BibTeX

@inproceedings{BUT155091,
  author="Jan {Brejcha} and Martin {Čadík}",
  title="Camera Orientation Estimation in Natural Scenes Using Semantic Cues",
  booktitle="2018 International Conference on 3D Vision",
  year="2018",
  pages="208--217",
  publisher="IEEE Computer Society",
  address="Verona",
  doi="10.1109/3DV.2018.00033",
  isbn="978-1-5386-2610-8",
  url="https://www.fit.vut.cz/research/publication/11829/"
}

Soubory

pdf semantic_orientation_IEEE.pdf 4 MB