Detail publikace

Estimating Extreme 3D Image Rotations using Cascaded Attention

DEKEL Shay, KELLER Yosi a ČADÍK Martin. Estimating Extreme 3D Image Rotations using Cascaded Attention. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle: IEEE Computer Society, 2024, s. 1-14. ISBN 979-8-3503-0129-8. Dostupné z: https://cadik.posvete.cz/
Název česky
Odhad extrémních 3D rotací kamery mezi snímky pomocí cascaded attention
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Dekel Shay (BIU)
Keller Yosi, prof. MSc., Ph.D. (BIU)
Čadík Martin, doc. Ing., Ph.D. (UPGM FIT VUT)
URL
Klíčová slova

odhad orientace kamery, extrémní rotace, 3D rotace, cascaded attention

Abstrakt

Odhad velkých až extrémních rotací mezi snímky je kritický pro řadu oblastí počítačového vidění. Složitá je zejména úloha, kdy mají snímky omezené nebo dokonce nepřekrývající se zorná pole. V této práci navrhujeme přístup založený na pozornosti (attention) s řadou nových algoritmických komponent. Protože se odhad rotace týká obrazových párů, zavádíme nové schéma destilace informace z obrazů pomocí dekodérů ke zlepšení kvality kódované informace, tzv. embeddingu. Zatímco současné metody počítají 4D korelační objem (4DCV) kódující vztahy mezi snímky, navrhujeme využití křížové pozornosti (cross-attention) mezi aktivačními mapami, který vede na kvalitnější ekvivalent 4DCV. V článku dále představujeme kaskádovou techniku založenou na dekodéru pro iterativní zpřesňování křížové pozornosti a odhadu rotace. Náš přístup předčí současné nejmodernější metody odhadu extrémní rotace. Kód metody zpřístupňujeme veřejnosti.

Rok
2024
Strany
1-14
Sborník
Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
Konference
The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2024, Seattle Convention Center, US
ISBN
979-8-3503-0129-8
Vydavatel
IEEE Computer Society
Místo
Seattle, US
BibTeX
@INPROCEEDINGS{FITPUB13178,
   author = "Shay Dekel and Yosi Keller and Martin \v{C}ad\'{i}k",
   title = "Estimating Extreme 3D Image Rotations using Cascaded Attention",
   pages = "1--14",
   booktitle = "Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)",
   year = 2024,
   location = "Seattle, US",
   publisher = "IEEE Computer Society",
   ISBN = "979-8-3503-0129-8",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13178"
}
Nahoru