已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Unified Spatial-Frequency Modeling and Alignment for Multi-Scale Small Object Detection

计算机科学 比例(比率) 对象(语法) 人工智能 遥感 计算机视觉 模式识别(心理学) 地图学 地理
作者
Jing Liu,Ying Wang,Yanyan Cao,Chaoping Guo,Peijun Shi,Pan Li
出处
期刊:Symmetry [Multidisciplinary Digital Publishing Institute]
卷期号:17 (2): 242-242
标识
DOI:10.3390/sym17020242
摘要

Small object detection in aerial imagery remains challenging due to sparse feature representation, limited spatial resolution, and complex background interference. Current deep learning approaches enhance detection performance through multi-scale feature fusion, leveraging convolutional operations to expand the receptive field or self-attention mechanisms for global context modeling. However, these methods primarily rely on spatial-domain features, while self-attention introduces high computational costs, and conventional fusion strategies (e.g., concatenation or addition) often result in weak feature correlation or boundary misalignment. To address these challenges, we propose a unified spatial-frequency modeling and multi-scale alignment fusion framework, termed USF-DETR, for small object detection. The framework comprises three key modules: the Spatial-Frequency Interaction Backbone (SFIB), the Dual Alignment and Balance Fusion FPN (DABF-FPN), and the Efficient Attention-AIFI (EA-AIFI). The SFIB integrates the Scharr operator for spatial edge and detail extraction and FFT/IFFT for capturing frequency-domain patterns, achieving a balanced fusion of global semantics and local details. The DABF-FPN employs bidirectional geometric alignment and adaptive attention to enhance the significance expression of the target area, suppress background noise, and improve feature asymmetry across scales. The EA-AIFI streamlines the Transformer attention mechanism by removing key-value interactions and encoding query relationships via linear projections, significantly boosting inference speed and contextual modeling. Experiments on the VisDrone and TinyPerson datasets demonstrate the effectiveness of USF-DETR, achieving improvements of 2.3% and 1.4% mAP over baselines, respectively, while balancing accuracy and computational efficiency. The framework outperforms state-of-the-art methods in small object detection.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
pegasus0802完成签到,获得积分10
刚刚
江城一霸完成签到,获得积分10
1秒前
徐hhh完成签到 ,获得积分10
4秒前
492357816完成签到,获得积分10
5秒前
6秒前
奋斗靖仇完成签到 ,获得积分10
8秒前
8秒前
程风破浪完成签到,获得积分10
9秒前
9秒前
yn完成签到,获得积分20
10秒前
只只发布了新的文献求助10
12秒前
xiao完成签到 ,获得积分10
14秒前
kouryoufu完成签到,获得积分10
15秒前
15秒前
后会无期完成签到,获得积分10
15秒前
彭于晏应助automan采纳,获得10
16秒前
科研通AI2S应助yn采纳,获得10
17秒前
豆乳米麻薯完成签到 ,获得积分10
19秒前
每天都是好时光完成签到 ,获得积分10
21秒前
眯眯眼的谷冬完成签到 ,获得积分10
21秒前
pass完成签到 ,获得积分10
22秒前
zhj发布了新的文献求助10
22秒前
22秒前
研友_ng9E28完成签到,获得积分10
23秒前
zhj完成签到,获得积分20
26秒前
NexusExplorer应助只只采纳,获得10
27秒前
平常安雁完成签到 ,获得积分10
28秒前
xona完成签到,获得积分10
28秒前
喜看财经完成签到,获得积分10
28秒前
要顺顺顺顺顺顺顺利完成签到 ,获得积分10
29秒前
千寻完成签到,获得积分10
32秒前
酷酷涫完成签到 ,获得积分0
33秒前
虚拟的柠檬完成签到,获得积分10
33秒前
爆米花应助喜看财经采纳,获得10
34秒前
纪富完成签到 ,获得积分10
35秒前
楠木完成签到 ,获得积分10
35秒前
Master完成签到 ,获得积分10
35秒前
36秒前
芜厸完成签到,获得积分10
37秒前
玖月完成签到 ,获得积分10
41秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 3000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
T/CAB 0344-2024 重组人源化胶原蛋白内毒素去除方法 1000
Maneuvering of a Damaged Navy Combatant 650
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3775841
求助须知:如何正确求助?哪些是违规求助? 3321468
关于积分的说明 10205713
捐赠科研通 3036525
什么是DOI,文献DOI怎么找? 1666256
邀请新用户注册赠送积分活动 797334
科研通“疑难数据库(出版商)”最低求助积分说明 757794