A video object detector with Spatio-Temporal Attention Module for micro UAV detection

计算机科学 人工智能 探测器 计算机视觉 目标检测 对象(语法) 模式识别(心理学) 电信
作者
Haozhi Xu,Zhigang Ling,Xiaofang Yuan,Yaonan Wang
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:597: 127973-127973 被引量:11
标识
DOI:10.1016/j.neucom.2024.127973
摘要

Many deep neural network-based methods have recently been proposed for object detection due to the significant success of deep learning in computer vision. However, existing object detection methods typically extract the appearance features of objects from single image so that they usually suffer from poor performance in detecting micro Unmanned Aerial Vehicle (UAV), because micro UAV lacks of rich color, shape and texture information. To address this issue, we introduce the temporal information of objects from videos and develop a Spatio-Temporal Attention Module (STAM) to efficiently enhance feature map extraction for detecting micro UAV, and then integrate STAM into YOLOX to develop a video object detector for micro UAV. Meanwhile, we propose a lightweight Spatial Pyramid Pooling (SPP) module termed Group Simplified Spatial Pyramid Pooling-Fast with Cross Stage Partial (Group SimSPPFCSP) for the backbone's final stage layer to efficiently and lightly extract more semantic information, and we propose a neck with rich propagation pathways (NRPP) to facilitate the effective propagation of spatial and temporal information across different levels. Furthermore, we propose two data augmentation operations including SeqMosaic and SeqMixUp, to augment video data for video object detection. Experimental results show that our model can achieve competitive precision (with 5.0 mAP and 8.1 mAPSmall improvement) while maintaining real-time inference speed (35.3 fps).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
NTHU_KAO完成签到,获得积分10
1秒前
2秒前
2秒前
Owen应助chivu1980采纳,获得20
2秒前
Jane完成签到,获得积分10
2秒前
3秒前
lily发布了新的文献求助10
3秒前
LGJ完成签到,获得积分10
3秒前
obaica发布了新的文献求助10
3秒前
3秒前
传统的以蓝完成签到,获得积分10
4秒前
4秒前
ygg完成签到,获得积分10
4秒前
小艺完成签到,获得积分10
4秒前
科研通AI2S应助动人的面包采纳,获得10
4秒前
yqt完成签到,获得积分10
4秒前
牙牙完成签到 ,获得积分10
4秒前
12完成签到 ,获得积分20
4秒前
负责的惜文完成签到,获得积分10
4秒前
丽莉完成签到,获得积分20
4秒前
gzhoax应助川上富江采纳,获得10
5秒前
zz发布了新的文献求助10
5秒前
ax完成签到,获得积分10
5秒前
杜嘟嘟完成签到,获得积分10
6秒前
麦麦爸完成签到,获得积分10
6秒前
6秒前
Orange应助123采纳,获得10
7秒前
LIU完成签到,获得积分10
7秒前
7秒前
niulugai完成签到,获得积分10
7秒前
李修名完成签到,获得积分10
7秒前
PEGA发布了新的文献求助10
7秒前
Hello应助半熟芝士采纳,获得10
7秒前
Underwood111完成签到,获得积分10
7秒前
7秒前
好有趣发布了新的文献求助10
8秒前
8秒前
慕昊强完成签到,获得积分10
8秒前
doomedQL完成签到,获得积分10
8秒前
知性的觅露完成签到,获得积分10
8秒前
高分求助中
Introduction to Helicopter and Tiltrotor Flight Simulation, Second Edition 2000
Overcoming Stigma and Bias in Obesity Management 800
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Materials selection in mechanical design 500
Bounds for Statistical Estimation in Semiparametric Models 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6487738
求助须知:如何正确求助?哪些是违规求助? 8286136
关于积分的说明 17673955
捐赠科研通 5576722
什么是DOI,文献DOI怎么找? 2913697
邀请新用户注册赠送积分活动 1890679
关于科研通互助平台的介绍 1748361