亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

HitFusion: Infrared and Visible Image Fusion for High-level Vision Tasks Using Transformer

计算机科学 计算机视觉 人工智能 变压器 图像融合 红外线的 图像(数学) 光学 电气工程 工程类 电压 物理
作者
Jun Chen,Jianfeng Ding,Jiayi Ma
出处
期刊:IEEE Transactions on Multimedia [Institute of Electrical and Electronics Engineers]
卷期号:: 1-15 被引量:1
标识
DOI:10.1109/tmm.2024.3405714
摘要

This study proposes an innovative network to fuse infrared and visible images, called HitFusion, which uses the cross-feature transformer module and is compatible with high-level vision tasks. Firstly, existing image fusion approaches primarily concentrate on optimizing human visual perception and image metrics. To enhance the performance of the fusion network in subsequent high-level vision tasks, a segmentation network and a corresponding loss are introduced into the fusion network training process. Specifically, we devise a three-stage training strategy to render the fusion network more suitable for high-level vision tasks, guided by the segmentation network and broadening the fusion network's training set to boost its generalization capability. Secondly, current transformer-based image fusion methods neglect the interaction between visible texture features and infrared contrast features. To tackle this, the cross-feature transformer module is proposed, allowing the fusion network to learn the cross-feature correlation and long-range dependencies between source images, thus achieving fusion results with good complementarity. Finally, a dual-branch fusion network is proposed, based on the distinct characteristics of different images, that targets the extraction of deep features from source images utilizing contrast residual and texture enhancement modules to achieve improved fusion results. Extensive experimental results reveal that our HitFusion method excels in both qualitative and quantitative assessments, while also demonstrating superior performance in addressing high-level vision tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
SW发布了新的文献求助10
1秒前
nav完成签到 ,获得积分10
25秒前
量子星尘发布了新的文献求助10
30秒前
111111111发布了新的文献求助10
54秒前
1分钟前
1分钟前
量子星尘发布了新的文献求助10
2分钟前
2分钟前
2分钟前
优秀的流沙完成签到,获得积分10
2分钟前
3分钟前
3分钟前
CipherSage应助科研通管家采纳,获得10
3分钟前
十二倍根号二完成签到,获得积分20
3分钟前
量子星尘发布了新的文献求助10
3分钟前
3分钟前
SW完成签到,获得积分10
4分钟前
CipherSage应助SW采纳,获得10
4分钟前
4分钟前
SW发布了新的文献求助10
4分钟前
4分钟前
科目三应助科研通管家采纳,获得10
5分钟前
zsmj23完成签到 ,获得积分0
5分钟前
量子星尘发布了新的文献求助10
5分钟前
5分钟前
研小小小小白完成签到,获得积分10
5分钟前
111111111发布了新的文献求助10
5分钟前
6分钟前
6分钟前
6分钟前
sofardli发布了新的文献求助20
6分钟前
6分钟前
nanali19发布了新的文献求助10
6分钟前
6分钟前
nanali19完成签到,获得积分10
6分钟前
万能图书馆应助sofardli采纳,获得10
6分钟前
6分钟前
量子星尘发布了新的文献求助10
7分钟前
曦麟完成签到 ,获得积分10
7分钟前
7分钟前
高分求助中
The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 2400
Ophthalmic Equipment Market by Devices(surgical: vitreorentinal,IOLs,OVDs,contact lens,RGP lens,backflush,diagnostic&monitoring:OCT,actorefractor,keratometer,tonometer,ophthalmoscpe,OVD), End User,Buying Criteria-Global Forecast to2029 2000
Optimal Transport: A Comprehensive Introduction to Modeling, Analysis, Simulation, Applications 800
Official Methods of Analysis of AOAC INTERNATIONAL 600
ACSM’s Guidelines for Exercise Testing and Prescription, 12th edition 588
A Preliminary Study on Correlation Between Independent Components of Facial Thermal Images and Subjective Assessment of Chronic Stress 500
T/CIET 1202-2025 可吸收再生氧化纤维素止血材料 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3957065
求助须知:如何正确求助?哪些是违规求助? 3503084
关于积分的说明 11111255
捐赠科研通 3234124
什么是DOI,文献DOI怎么找? 1787751
邀请新用户注册赠送积分活动 870772
科研通“疑难数据库(出版商)”最低求助积分说明 802264