Transformer-based cross-modality interaction guidance network for RGB-T salient object detection

计算机科学 人工智能 突出 计算机视觉 RGB颜色模型 融合机制 编码器 融合 模式识别(心理学) 脂质双层融合 哲学 语言学 操作系统
作者
Jincheng Luo,Yongjun Li,Bo Li,Xinru Zhang,C. Li,Zhimin Chenjin,Jingyi He,Yifei Liang
出处
期刊:Neurocomputing [Elsevier]
卷期号:600: 128149-128149 被引量:2
标识
DOI:10.1016/j.neucom.2024.128149
摘要

Exploring more effective multimodal fusion strategies is still challenging for RGB-T salient object detection (SOD). Most RGB-T SOD methods tend to focus on the strategy of acquiring modal complementary features by utilizing foreground information while ignoring the importance of background information for salient object localization. In addition, feature fusion without information filtering may introduce more noise. To solve these problems, this paper proposes a new cross-modal interaction guidance network (CIGNet) for RGB-T saliency object detection. Specifically, we construct a transformer-based dual-stream encoder to extract multimodal features. In the decoder, we propose an attention mechanism-based modal information complementary module (MICM) for capturing cross-modal complementary information for global comparison and salient object localization. Based on the MICM features, we design a multi-scale adaptive fusion module (MAFM) to find the optimal salient region of the multi-scale fusion process and reduce redundant features. In order to enhance the completeness of salient features after multi-scale feature fusion, this paper proposes the saliency region mining module (SRMM), which corrects the features in the boundary neighborhood by exploiting the differences between foreground and background pixels and the boundary. Comparisons with other state-of-the-art methods on three RGB-T datasets and five RGB-D datasets, the experimental results demonstrate the superiority and extensiveness of the proposed CIGNet.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
量子星尘发布了新的文献求助10
刚刚
shen5920完成签到,获得积分10
刚刚
子车茗应助ff采纳,获得30
刚刚
faye完成签到,获得积分10
刚刚
自信的访云完成签到,获得积分10
1秒前
海鑫王完成签到,获得积分10
1秒前
1秒前
水蜜桃完成签到 ,获得积分10
2秒前
min完成签到,获得积分20
2秒前
灿烂千阳发布了新的文献求助10
3秒前
SciGPT应助吴鹏采纳,获得10
4秒前
小马甲应助循环不好的Cu采纳,获得10
4秒前
传奇3应助yayale采纳,获得10
4秒前
xxl完成签到 ,获得积分10
4秒前
lllllllxy发布了新的文献求助10
5秒前
平常的化蛹完成签到 ,获得积分10
5秒前
科研通AI2S应助Luuu采纳,获得10
5秒前
6秒前
6秒前
7秒前
xiangzq完成签到,获得积分10
7秒前
8秒前
比奇堡居民完成签到,获得积分10
8秒前
李爱国应助小米采纳,获得10
8秒前
涵泽完成签到,获得积分10
9秒前
10秒前
sunny完成签到,获得积分10
10秒前
10秒前
yy完成签到,获得积分10
11秒前
量子星尘发布了新的文献求助30
11秒前
杨杨应助小红小绿采纳,获得10
12秒前
hh完成签到 ,获得积分10
14秒前
14秒前
14秒前
隐形曼青应助什么都不想采纳,获得10
15秒前
刘纾菡完成签到,获得积分10
15秒前
sunny发布了新的文献求助10
15秒前
15秒前
酷波er应助收手吧大哥采纳,获得10
16秒前
尽舜尧发布了新的文献求助10
16秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Forensic and Legal Medicine Third Edition 5000
Introduction to strong mixing conditions volume 1-3 5000
the Oxford Guide to the Bantu Languages 3000
Agyptische Geschichte der 21.30. Dynastie 3000
„Semitische Wissenschaften“? 1510
从k到英国情人 1500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5762020
求助须知:如何正确求助?哪些是违规求助? 5533545
关于积分的说明 15401764
捐赠科研通 4898295
什么是DOI,文献DOI怎么找? 2634801
邀请新用户注册赠送积分活动 1582925
关于科研通互助平台的介绍 1538165