Dual Swin-transformer based mutual interactive network for RGB-D salient object detection

计算机科学 RGB颜色模型 人工智能 编码器 模式识别(心理学) 骨干网 变压器 解码方法 深度学习 计算机视觉 算法 计算机网络 物理 量子力学 电压 操作系统
作者
Chao Zeng,Sam Kwong,Horace H. S. Ip
出处
期刊:Neurocomputing [Elsevier]
卷期号:559: 126779-126779 被引量:15
标识
DOI:10.1016/j.neucom.2023.126779
摘要

Depth information for RGB-D Salient Object Detection(SOD) is important and conventional deep models are usually relied on the CNN feature extractors. The long-range contextual dependencies, dense modeling on the saliency decoder, and multi-task learning assistance are usually ignored. In this work, we propose a Dual Swin-Transformer-based Mutual Interactive Network (DTMINet), aiming to learn contextualized, dense, and edge-aware features for RGB-D SOD. We adopt the Swin-Transformer as the visual backbone to extract contextualized features. A self-attention-based Cross-Modality Interaction module is proposed to strengthen the visual backbone for cross-modal interaction. In addition, a Gated Modality Attention module is designed for cross-modal fusion. At different decoding stages, enhanced with dense connections and progressively merge the multi-level encoding features with the proposed Dense Saliency Decoder. Considering the depth quality issue, a Skip Convolution module is introduced to provide guidance to the RGB modality for the saliency prediction. In addition, we add the edge prediction to the saliency predictor to regularize the learning process. Comprehensive experiments on five standard RGB-D SOD benchmark datasets over four evaluation metrics demonstrate the superiority of the proposed method.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
完美世界应助wonder采纳,获得10
2秒前
黎莉莉完成签到,获得积分10
4秒前
jiayou彭完成签到 ,获得积分10
5秒前
Zhang发布了新的文献求助20
7秒前
8秒前
Breath发布了新的文献求助30
9秒前
LabRat完成签到 ,获得积分10
13秒前
Ben完成签到,获得积分10
14秒前
Ava应助zzz采纳,获得10
17秒前
852应助真三采纳,获得10
18秒前
fst发布了新的文献求助10
20秒前
Reese完成签到 ,获得积分10
20秒前
所所应助yuaaaann采纳,获得50
23秒前
墨墨完成签到,获得积分10
24秒前
1DDDDD发布了新的社区帖子
27秒前
Pearl应助阿滕采纳,获得10
29秒前
fst完成签到,获得积分10
31秒前
蔡雨岑完成签到 ,获得积分10
32秒前
saberLee完成签到,获得积分10
38秒前
lelucermaire发布了新的文献求助10
43秒前
flee完成签到,获得积分10
46秒前
46秒前
娇娇大王完成签到,获得积分10
50秒前
51秒前
雄哥关注了科研通微信公众号
55秒前
21完成签到 ,获得积分10
56秒前
谢健完成签到 ,获得积分10
56秒前
从容芮应助flee采纳,获得30
56秒前
外向梨愁完成签到 ,获得积分20
1分钟前
慕青应助科研通管家采纳,获得10
1分钟前
Orange应助科研通管家采纳,获得10
1分钟前
科目三应助科研通管家采纳,获得10
1分钟前
天天快乐应助科研通管家采纳,获得10
1分钟前
搜集达人应助科研通管家采纳,获得10
1分钟前
隐形曼青应助科研通管家采纳,获得10
1分钟前
CipherSage应助科研通管家采纳,获得10
1分钟前
丘比特应助科研通管家采纳,获得10
1分钟前
1分钟前
Dusk大寺柯完成签到 ,获得积分10
1分钟前
鳗鱼三毒发布了新的文献求助10
1分钟前
高分求助中
LNG地下式貯槽指針(JGA Guideline-107)(LNG underground storage tank guidelines) 1000
Second Language Writing (2nd Edition) by Ken Hyland, 2019 1000
Generalized Linear Mixed Models 第二版 1000
rhetoric, logic and argumentation: a guide to student writers 1000
QMS18Ed2 | process management. 2nd ed 1000
Asymptotically optimum binary codes with correction for losses of one or two adjacent bits 800
Operative Techniques in Pediatric Orthopaedic Surgery 510
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2923471
求助须知:如何正确求助?哪些是违规求助? 2568831
关于积分的说明 6941912
捐赠科研通 2223517
什么是DOI,文献DOI怎么找? 1181936
版权声明 588950
科研通“疑难数据库(出版商)”最低求助积分说明 578406