Multi-Spatial Pyramid Feature and Optimizing Focal Loss Function for Object Detection

计算机科学 联营 目标检测 人工智能 交叉熵 棱锥(几何) 卷积神经网络 模式识别(心理学) 特征(语言学) 对象(语法) 分割 计算机视觉 数学 几何学 语言学 哲学
作者
Shengye Wang,Zhong Qu,Le-yuan Gao
出处
期刊:IEEE transactions on intelligent vehicles [Institute of Electrical and Electronics Engineers]
卷期号:9 (1): 1054-1065 被引量:8
标识
DOI:10.1109/tiv.2023.3282996
摘要

Previous deep convolutional neural network research has made significant progress toward improving the speed and accuracy of object detection. However, despite these advancements, the inaccurate detection of multi-object (small objects) remains challenging in the traffic environments. In this paper, we propose a new architecture called YOLOM, which is specifically designed to achieve enhanced multi-object (small objects) detection precision. YOLOM incorporates several innovative features: a multi-spatial pyramid (MSP), an optimized focal loss (OFLoss) function, and an objectness loss that incorporates effective intersection over union (EIoU) calculations. These features collectively yield enhanced accuracy and reduce the miss rate of small objects, particularly in the multi-object cases. According to the sizes of receptive field features with different spatial scales with pooling layers, we propose the MSP module. We optimize the focal loss as a classification function instead of the cross-entropy loss, which solves some class imbalance problems caused by anchor-free detection when encountering disparate datasets. Due to the superior performance of EIoU in confidence scoring, we use EIoU to participate in the objectness loss calculation of our work. Therefore, our method substitutes EIoU for YOLOX's objectness loss. The experimental results demonstrate that our strategies significantly outperform some end-to-end object detection methods.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
FashionBoy应助rinna采纳,获得30
1秒前
Lucie发布了新的文献求助10
2秒前
YT完成签到,获得积分10
2秒前
劲秉应助笑点低涟妖采纳,获得10
4秒前
8秒前
Lucie完成签到,获得积分10
9秒前
哦了欧了完成签到 ,获得积分10
10秒前
沉默的皮卡丘完成签到 ,获得积分10
12秒前
16秒前
lierking应助求知的周采纳,获得30
17秒前
19秒前
奥拉夫发布了新的文献求助30
19秒前
20秒前
20秒前
平仄发布了新的文献求助30
21秒前
光亮蜗牛完成签到 ,获得积分10
23秒前
l127完成签到,获得积分10
23秒前
Lqian_Yu发布了新的文献求助10
24秒前
bkagyin应助肉肉采纳,获得10
24秒前
26秒前
27秒前
27秒前
xxww完成签到,获得积分10
29秒前
菘蓝泽蓼完成签到 ,获得积分10
29秒前
CodeCraft应助zyb采纳,获得10
31秒前
MapleLeaf发布了新的文献求助30
31秒前
32秒前
上官若男应助慧仔53采纳,获得10
33秒前
伍思光发布了新的文献求助10
35秒前
37秒前
万能图书馆应助mint采纳,获得10
37秒前
肉肉发布了新的文献求助10
38秒前
39秒前
40秒前
41秒前
清秀的含雁完成签到,获得积分10
41秒前
伍思光完成签到,获得积分20
42秒前
Zack发布了新的文献求助30
44秒前
令狐双发布了新的文献求助10
44秒前
小黄发布了新的文献求助10
45秒前
高分求助中
Востребованный временем 2500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
지식생태학: 생태학, 죽은 지식을 깨우다 600
海南省蛇咬伤流行病学特征与预后影响因素分析 500
Neuromuscular and Electrodiagnostic Medicine Board Review 500
ランス多機能化技術による溶鋼脱ガス処理の高効率化の研究 500
Relativism, Conceptual Schemes, and Categorical Frameworks 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3462603
求助须知:如何正确求助?哪些是违规求助? 3056160
关于积分的说明 9050826
捐赠科研通 2745793
什么是DOI,文献DOI怎么找? 1506578
科研通“疑难数据库(出版商)”最低求助积分说明 696165
邀请新用户注册赠送积分活动 695677