Cross-Modal Feature Fusion and Interaction Strategy for CNN-Transformer-Based Object Detection in Visual and Infrared Remote Sensing Imagery

计算机科学 人工智能 保险丝(电气) 情态动词 计算机视觉 特征提取 模式识别(心理学) 目标检测 特征(语言学) 编码器 可视化 工程类 哲学 电气工程 化学 高分子化学 操作系统 语言学
作者
Jinyan Nie,He Sun,Xu Sun,Li Ni,Lianru Gao
出处
期刊:IEEE Geoscience and Remote Sensing Letters [Institute of Electrical and Electronics Engineers]
卷期号:21: 1-5 被引量:1
标识
DOI:10.1109/lgrs.2023.3339214
摘要

Due to the complementarity of visible and infrared images, it has become more favorable to fuse these two modalities to improve the object detection accuracy in the remote sensing area. However, there are still some problems to be solved. Most of the existing algorithms focus too much on the local information and ignore long-range information when performing feature extraction on different modalities. Besides, coarse weighted fusion strategies do not fully utilize the information from different modalities, and the fusion structure ignores the importance of intermodal information exchange. To tackle these problems, a cross-modal feature fusion and interaction strategy for the convolutional neural network (CNN)-transformer-based object detection in visual and infrared remote sensing imagery is proposed. We adopt a parallel structure to extract the features of different modalities, separately. In visual and infrared modality, the convolutional layers and transformer encoders are cascaded to fully extract both local and long-range information. The cross-modal feature fusion and interaction module (CFFIM) adopts the attention mechanisms to jointly fuse different modal features at the same scale to improve the diversity of fused features, and the feature interaction enables the sharing of visible and infrared information. Experiments on the VEDAI dataset have demonstrated the effectiveness of the proposed scheme compared to other state-of-the-art algorithms.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
深情安青应助不打烊采纳,获得50
2秒前
热卤素饭完成签到,获得积分10
3秒前
Maor完成签到,获得积分10
5秒前
FashionBoy应助锋芒不毕露采纳,获得10
6秒前
希望天下0贩的0应助XiangW采纳,获得10
7秒前
xyx发布了新的文献求助10
7秒前
搜集达人应助如意寒烟采纳,获得10
8秒前
传奇3应助动听千山采纳,获得10
9秒前
勤劳画笔完成签到 ,获得积分10
11秒前
seungmilee完成签到,获得积分20
12秒前
华仔应助tuo zhang采纳,获得10
13秒前
13秒前
小暴发布了新的文献求助10
16秒前
暮晓见完成签到 ,获得积分10
16秒前
chang发布了新的文献求助10
17秒前
香蕉觅云应助东郭一斩采纳,获得10
18秒前
jopaul完成签到,获得积分10
19秒前
20秒前
塵埃完成签到,获得积分10
20秒前
早早完成签到,获得积分10
21秒前
24秒前
qq应助张钰婷啦啦啦采纳,获得10
25秒前
28秒前
Nicole应助chang采纳,获得10
28秒前
28秒前
huaming完成签到,获得积分10
29秒前
可爱的函函应助大橙子采纳,获得200
30秒前
东郭一斩发布了新的文献求助10
30秒前
小暴完成签到,获得积分10
30秒前
史蒂芬张发布了新的文献求助10
31秒前
31秒前
32秒前
poile完成签到,获得积分10
32秒前
33秒前
XiangW发布了新的文献求助10
33秒前
bvh完成签到,获得积分20
36秒前
不打烊发布了新的文献求助50
37秒前
黄林旋发布了新的文献求助10
37秒前
暮晓见发布了新的文献求助10
37秒前
高分求助中
Sustainability in Tides Chemistry 2000
System in Systemic Functional Linguistics A System-based Theory of Language 1000
The Data Economy: Tools and Applications 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 800
Essentials of thematic analysis 700
Mantiden - Faszinierende Lauerjäger – Buch gebraucht kaufen 600
PraxisRatgeber Mantiden., faszinierende Lauerjäger. – Buch gebraucht kaufe 600
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3118624
求助须知:如何正确求助?哪些是违规求助? 2768826
关于积分的说明 7698490
捐赠科研通 2424235
什么是DOI,文献DOI怎么找? 1287711
科研通“疑难数据库(出版商)”最低求助积分说明 620554
版权声明 599950