AITFuse: Infrared and visible image fusion via adaptive interactive transformer learning

计算机科学 计算机视觉 融合 变压器 人工智能 红外线的 工程类 物理 光学 电气工程 电压 哲学 语言学
作者
Zhishe Wang,Fan Yang,Jing Sun,Jiawei Xu,Fengbao Yang,Xiaomei Yan
出处
期刊:Knowledge Based Systems [Elsevier]
卷期号:299: 111949-111949
标识
DOI:10.1016/j.knosys.2024.111949
摘要

Existing deep learning-based methods often follow either image-level or feature-level fusion frameworks to uniformly or separately extract features, ignoring the specialized interactive information learning, which may produce limited fusion performance. To tackle this challenge, we devise a powerful fusion baseline via adaptive interactive Transformer learning, namely AITFuse. Unlike previous methods, our network alternately incorporates local and global relationships through collaborative learning of both CNN and Transformer. In particular, we propose a cascaded token-wise and channel-wise Vision Transformer architecture with different attention mechanisms to model the long-range contexts, and allow feature communication across different tokens and independent channels in an interactive manner. On this basis, the modal-specific feature rectification module employs self-attention operation to revise distinctive features within the same domain for efficient encoding. Meanwhile, the cross-modal feature integration module constructs cross-attention mechanism to fuse complementary characteristics from different domains for multi-level decoding. In addition, we discard the learning position embedding to release our fusion model for the image of arbitrary sizes without splitting operations. Extensive experiments on mainstream datasets and downstream tasks demonstrate the rationality and superiority of our AITFuse. The codes will be available at https://github.com/Zhishe-Wang/AITFuse.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
彭十八发布了新的文献求助10
刚刚
木子完成签到 ,获得积分10
2秒前
wj完成签到 ,获得积分10
3秒前
GealAntS完成签到,获得积分0
4秒前
EiketsuChiy完成签到 ,获得积分0
4秒前
三颗石头完成签到,获得积分10
5秒前
尚影芷完成签到,获得积分10
7秒前
Cyaccc完成签到,获得积分10
8秒前
8秒前
大猫不吃鱼完成签到,获得积分10
8秒前
scitiancai完成签到,获得积分10
8秒前
10秒前
兔子不爱吃胡萝卜完成签到,获得积分10
10秒前
afli完成签到 ,获得积分0
11秒前
白华苍松发布了新的文献求助10
12秒前
王爷教你白给完成签到 ,获得积分10
13秒前
你是我爹完成签到 ,获得积分10
13秒前
zzg完成签到,获得积分10
13秒前
二月兰完成签到 ,获得积分10
14秒前
寒烟777发布了新的文献求助10
14秒前
15秒前
15秒前
棒棒糖完成签到,获得积分10
15秒前
15秒前
语亦菲扬921完成签到,获得积分10
16秒前
flymove完成签到,获得积分10
17秒前
尊敬飞丹完成签到,获得积分10
17秒前
海的呼唤发布了新的文献求助10
20秒前
lwk205完成签到,获得积分0
21秒前
犹豫勇完成签到,获得积分10
21秒前
Huang完成签到 ,获得积分0
21秒前
儒雅的冷梅完成签到 ,获得积分10
22秒前
Novice6354完成签到 ,获得积分10
22秒前
高兴冬灵完成签到,获得积分10
25秒前
sos完成签到,获得积分10
25秒前
研友_VZG7GZ应助kmoyy采纳,获得50
26秒前
温馨完成签到 ,获得积分10
27秒前
LILYpig完成签到 ,获得积分10
27秒前
赘婿应助ShuangqingYE采纳,获得10
29秒前
yukang完成签到,获得积分10
31秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2500
Востребованный временем 2500
Aspects of Babylonian celestial divination : the lunar eclipse tablets of enuma anu enlil 1500
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Neuromuscular and Electrodiagnostic Medicine Board Review 700
Examining the relationship between working capital management and firm performance: a state-of-the-art literature review and visualisation analysis 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3445148
求助须知:如何正确求助?哪些是违规求助? 3041234
关于积分的说明 8984161
捐赠科研通 2729821
什么是DOI,文献DOI怎么找? 1497204
科研通“疑难数据库(出版商)”最低求助积分说明 692167
邀请新用户注册赠送积分活动 689714