Detecting Rotated Objects as Gaussian Distributions and Its 3-D Generalization

一般化 人工智能 计算机科学 计算机视觉 高斯分布 模式识别(心理学) 高斯过程 数学 数学分析 物理 量子力学
作者
Xue Yang,Gefan Zhang,Xiaojiang Yang,Yue Zhou,Wentao Wang,Jin Tang,Tao He,Junchi Yan
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:: 1-18 被引量:53
标识
DOI:10.1109/tpami.2022.3197152
摘要

Existing detection methods commonly use a parameterized bounding box (BBox) to model and detect (horizontal) objects and an additional rotation angle parameter is used for rotated objects. We argue that such a mechanism has fundamental limitations in building an effective regression loss for rotation detection, especially for high-precision detection with high IoU (e.g., 0.75). Instead, we propose to model the rotated objects as Gaussian distributions. A direct advantage is that our new regression loss regarding the distance between two Gaussians e.g., Kullback-Leibler Divergence (KLD), can well align the actual detection performance metric, which is not well addressed in existing methods. Moreover, the two bottlenecks i.e., boundary discontinuity and square-like problem also disappear. We also propose an efficient Gaussian metric-based label assignment strategy to further boost the performance. Interestingly, by analyzing the BBox parameters' gradients under our Gaussian-based KLD loss, we show that these parameters are dynamically updated with interpretable physical meaning, which help explain the effectiveness of our approach, especially for high-precision detection. We extend our approach from 2-D to 3-D with a tailored algorithm design to handle the heading estimation, and experimental results on twelve public datasets (2-D/3-D, aerial/text/face images) with various base detectors show its superiority.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
charles完成签到,获得积分10
1秒前
星沉静默发布了新的文献求助10
3秒前
csj发布了新的文献求助10
3秒前
旧雨新知完成签到 ,获得积分0
3秒前
5秒前
5秒前
易酰水烊酸完成签到 ,获得积分10
7秒前
明天见发布了新的文献求助10
10秒前
无私追命发布了新的文献求助30
10秒前
yongziwu完成签到,获得积分10
12秒前
14秒前
Rondab应助ZHY采纳,获得10
14秒前
共享精神应助沉默傲芙采纳,获得10
14秒前
pp发布了新的文献求助10
18秒前
安等暖阳完成签到 ,获得积分10
18秒前
19秒前
20秒前
慕青应助明天见采纳,获得10
20秒前
元宵宵完成签到,获得积分10
25秒前
科目三应助csj采纳,获得10
25秒前
Zjx发布了新的文献求助10
26秒前
27秒前
苹果王子6699完成签到 ,获得积分10
27秒前
YC完成签到,获得积分10
28秒前
段小麻发布了新的文献求助10
30秒前
杰瑞发布了新的文献求助10
30秒前
31秒前
华仔应助典雅的俊驰采纳,获得10
32秒前
lankbki123发布了新的文献求助10
34秒前
35秒前
sysxxx发布了新的文献求助10
35秒前
小薛完成签到,获得积分0
36秒前
Albert完成签到,获得积分10
37秒前
李健的粉丝团团长应助A宝采纳,获得10
38秒前
LHZ发布了新的文献求助100
40秒前
明亮妙菱发布了新的文献求助10
40秒前
Capital完成签到,获得积分10
42秒前
43秒前
44秒前
高分求助中
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
A new approach to the extrapolation of accelerated life test data 1000
Indomethacinのヒトにおける経皮吸収 400
基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 370
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
Robot-supported joining of reinforcement textiles with one-sided sewing heads 320
Aktuelle Entwicklungen in der linguistischen Forschung 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3993097
求助须知:如何正确求助?哪些是违规求助? 3534001
关于积分的说明 11264347
捐赠科研通 3273705
什么是DOI,文献DOI怎么找? 1806142
邀请新用户注册赠送积分活动 883003
科研通“疑难数据库(出版商)”最低求助积分说明 809652