A Robust Feature Downsampling Module for Remote-Sensing Visual Tasks

增采样 计算机科学 特征(语言学) 稳健性(进化) 人工智能 分割 特征提取 子网 模式识别(心理学) 计算机视觉 图像(数学) 基因 化学 哲学 生物化学 语言学 计算机安全
作者
Wei Lu,Si-Bao Chen,Jin Tang,Chris Ding,Bin Luo
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:61: 1-12 被引量:54
标识
DOI:10.1109/tgrs.2023.3282048
摘要

Remote sensing (RS) images present unique challenges for computer vision due to lower resolution, smaller objects, and fewer features. Mainstream backbone networks show promising results for traditional visual tasks. However, they use convolution to reduce feature map dimensionality, which can result in information loss for small objects in RS images and decreased performance. To address this problem, we propose a new and universal downsampling module named Robust Feature Downsampling (RFD). RFD fuses multiple feature maps extracted by different downsampling techniques, creating a more robust feature map with a complementary set of features. Leveraging this, we overcome the limitations of conventional convolutional downsampling, resulting in more accurate and robust analysis of RS images. We develop two versions of RFD module, Shallow RFD (SRFD) and Deep RFD (DRFD), tailored to adapt to different stages of feature capture and improve feature robustness. We replace the downsampling layers of existing mainstream backbones with RFD module and conduct comparative experiments on several public RS image datasets. The results show significant improvements compared to baseline approaches in RS image classification, object detection, and semantic segmentation. Specifically, our RFD module achieved an average performance gain of 1.5% on NWPU-RESISC45 classification dataset without utilizing any additional pretraining data, resulting in state-of-the-art performance on this dataset. Moreover, in detection and segmentation tasks on DOTA and iSAID datasets, our RFD module outperforms the baseline approaches by 2-7% when utilizing pretraining data from NWPU-RESISC45. These results highlight the value of RFD module in enhancing the performance of RS visual tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
Alexander完成签到,获得积分10
6秒前
文静曼安发布了新的文献求助10
6秒前
7秒前
我是老大应助juan采纳,获得10
7秒前
觉主发布了新的文献求助10
7秒前
10秒前
10秒前
lalala完成签到,获得积分20
11秒前
南吕完成签到 ,获得积分10
11秒前
东东完成签到,获得积分10
12秒前
yin景景发布了新的文献求助10
14秒前
薯条完成签到,获得积分10
15秒前
元舒甜完成签到,获得积分10
15秒前
16秒前
紫薰完成签到,获得积分10
18秒前
CodeCraft应助大气的人雄采纳,获得10
20秒前
叕叕完成签到,获得积分10
21秒前
senli2018发布了新的文献求助10
24秒前
25秒前
丘比特应助莓莓采纳,获得20
27秒前
锦瑟完成签到 ,获得积分10
27秒前
Talha发布了新的文献求助10
29秒前
29秒前
酥瓜完成签到 ,获得积分10
31秒前
呆萌雁玉完成签到,获得积分10
31秒前
学术laji发布了新的文献求助10
34秒前
healthy发布了新的文献求助10
35秒前
35秒前
元舒甜发布了新的文献求助10
35秒前
37秒前
38秒前
CodeCraft应助weiyi采纳,获得10
38秒前
38秒前
GaN完成签到,获得积分20
39秒前
40秒前
40秒前
Llllllllily完成签到,获得积分10
40秒前
受伤问凝完成签到 ,获得积分10
40秒前
lili发布了新的文献求助10
41秒前
高分求助中
Encyclopedia of Quaternary Science Third edition 2025 12000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
Holistic Discourse Analysis 600
Constitutional and Administrative Law 600
Vertebrate Palaeontology, 5th Edition 530
Fiction e non fiction: storia, teorie e forme 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5344792
求助须知:如何正确求助?哪些是违规求助? 4479975
关于积分的说明 13944959
捐赠科研通 4377204
什么是DOI,文献DOI怎么找? 2405147
邀请新用户注册赠送积分活动 1397687
关于科研通互助平台的介绍 1370008