Image Fusion Transformer

计算机科学 人工智能 变压器 编码器 图像融合 融合 卷积神经网络 模式识别(心理学) 图像(数学) 计算机视觉 工程类 语言学 操作系统 电气工程 哲学 电压
作者
Vibashan VS,Jeya Maria Jose Valanarasu,Poojan Oza,Vishal M. Patel
标识
DOI:10.1109/icip46576.2022.9897280
摘要

In image fusion, images obtained from different sensors are fused to generate a single image with enhanced information. In recent years, state-of-the-art methods have adopted Convolution Neural Networks (CNNs) to encode meaningful features for image fusion. Specifically, CNN-based methods perform image fusion by fusing local features. However, they do not consider long-range dependencies that are present in the image. Transformer-based models are designed to overcome this by modelling the long-range dependencies with the help of self-attention mechanism. This motivates us to propose a novel Image Fusion Transformer (IFT) where we develop a transformer-based multi-scale fusion strategy that attends to both local and long-range information (or global context). The proposed method follows a two-stage training approach. In the first stage, we train an auto-encoder to extract deep features at multiple scales. In the second stage, multi-scale features are fused using a Spatio-Transformer (ST) fusion strategy. The ST fusion blocks are comprised of a CNN and a transformer branch which captures local and long-range features, respectively. Extensive experiments on multiple benchmark datasets show that the proposed method performs better than many competitive fusion algorithms. Furthermore, we show the effectiveness of the proposed ST fusion strategy with an ablation analysis. 1
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
7秒前
嗯哼应助灰色与青采纳,获得20
9秒前
苗条的小肥羊完成签到,获得积分10
10秒前
芝芝发布了新的文献求助10
10秒前
共享精神应助一三五七九采纳,获得10
10秒前
11秒前
斯威特关注了科研通微信公众号
11秒前
14秒前
15秒前
高高烙完成签到,获得积分10
15秒前
NexusExplorer应助熊98采纳,获得10
15秒前
17秒前
17秒前
SUN发布了新的文献求助10
19秒前
尹尹完成签到,获得积分10
20秒前
20秒前
丢丢银发布了新的文献求助10
20秒前
高高烙发布了新的文献求助10
20秒前
Jun完成签到 ,获得积分10
21秒前
英俊的铭应助yv采纳,获得10
22秒前
24秒前
28秒前
丢丢银完成签到,获得积分10
30秒前
星辰大海完成签到 ,获得积分10
34秒前
36秒前
37秒前
lllhk发布了新的文献求助10
40秒前
叁壶薏苡发布了新的文献求助10
43秒前
小马甲应助研友_闾丘枫采纳,获得10
45秒前
无足鸟完成签到,获得积分10
46秒前
47秒前
隐形曼青应助北北采纳,获得10
48秒前
如意曼雁完成签到,获得积分10
48秒前
48秒前
50秒前
52秒前
HJN完成签到 ,获得积分10
52秒前
53秒前
53秒前
54秒前
高分求助中
LNG地下式貯槽指針(JGA指-107-19)(Recommended practice for LNG inground storage) 1000
Second Language Writing (2nd Edition) by Ken Hyland, 2019 1000
Generalized Linear Mixed Models 第二版 1000
rhetoric, logic and argumentation: a guide to student writers 1000
QMS18Ed2 | process management. 2nd ed 1000
Asymptotically optimum binary codes with correction for losses of one or two adjacent bits 800
Operative Techniques in Pediatric Orthopaedic Surgery 510
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2923031
求助须知:如何正确求助?哪些是违规求助? 2567919
关于积分的说明 6940358
捐赠科研通 2223183
什么是DOI,文献DOI怎么找? 1181693
版权声明 588941
科研通“疑难数据库(出版商)”最低求助积分说明 578218