HeightFormer: Explicit Height Modeling without Extra Data for Camera-only 3D Object Detection in Bird’s Eye View

计算机视觉 人工智能 计算机科学 目标检测 对象(语法) 计算机图形学(图像) 模式识别(心理学)
作者
Yiming Wu,Ruixiang Li,Zequn Qin,Xinhai Zhao,Xi Li
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:: 1-1
标识
DOI:10.1109/tip.2024.3427701
摘要

Vision-based Bird's Eye View (BEV) representation is an emerging perception formulation for autonomous driving. The core challenge is to construct BEV space with multi-camera features, which is a one-to-many ill-posed problem. Diving into all previous BEV representation generation methods, we found that most of them fall into two types: modeling depths in image views or modeling heights in the BEV space, mostly in an implicit way. In this work, we propose to explicitly model heights in the BEV space, which needs no extra data like LiDAR and can fit arbitrary camera rigs and types compared to modeling depths. Theoretically, we give proof of the equivalence between height-based methods and depth-based methods. Considering the equivalence and some advantages of modeling heights, we propose HeightFormer, which models heights and uncertainties in a self-recursive way. Without any extra data, the proposed Height-Former could estimate heights in BEV accurately. Benchmark results show that the performance of HeightFormer achieves SOTA compared with those camera-only methods.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
123321321345发布了新的文献求助30
刚刚
刚刚
1秒前
2秒前
momo发布了新的文献求助10
2秒前
osolemioo发布了新的文献求助30
2秒前
涔雨发布了新的文献求助10
2秒前
2秒前
某某某完成签到,获得积分10
3秒前
cslghe发布了新的文献求助10
3秒前
gffh完成签到,获得积分10
4秒前
Young完成签到 ,获得积分10
4秒前
明杰完成签到,获得积分10
4秒前
wzx发布了新的文献求助10
4秒前
YCQ完成签到,获得积分10
5秒前
zz完成签到,获得积分10
6秒前
lucky发布了新的文献求助10
7秒前
其7完成签到,获得积分10
8秒前
8秒前
9秒前
aa完成签到,获得积分10
9秒前
止山完成签到,获得积分10
9秒前
irisjlj发布了新的文献求助10
11秒前
qiao给nolooker的求助进行了留言
12秒前
坦率的海豚完成签到,获得积分10
13秒前
14秒前
研友_842aln发布了新的文献求助10
14秒前
调皮嫣娆发布了新的文献求助10
14秒前
HIKING发布了新的文献求助10
15秒前
15秒前
16秒前
烟花应助moumou采纳,获得10
17秒前
17秒前
卡卡完成签到 ,获得积分20
17秒前
mushanes完成签到 ,获得积分10
18秒前
英姑应助xiaojinzi采纳,获得10
18秒前
wubinbin完成签到 ,获得积分10
19秒前
酷波er应助123采纳,获得10
19秒前
Hello应助科研通管家采纳,获得10
19秒前
CodeCraft应助科研通管家采纳,获得10
20秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 2000
The Social Psychology of Citizenship 1000
Streptostylie bei Dinosauriern nebst Bemerkungen über die 540
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Brittle Fracture in Welded Ships 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5923464
求助须知:如何正确求助?哪些是违规求助? 6932842
关于积分的说明 15821299
捐赠科研通 5051114
什么是DOI,文献DOI怎么找? 2717628
邀请新用户注册赠送积分活动 1672409
关于科研通互助平台的介绍 1607785