Cross-Modal and Cross-Level Attention Interaction Network for Salient Object Detection

计算机科学 保险丝(电气) 人工智能 RGB颜色模型 互补性(分子生物学) 情态动词 卷积神经网络 模式识别(心理学) 成对比较 工程类 遗传学 生物 电气工程 化学 高分子化学
作者
Fasheng Wang,Yiming Su,Ruimin Wang,Jing Sun,Fuming Sun,Haojie Li
出处
期刊:IEEE transactions on artificial intelligence [Institute of Electrical and Electronics Engineers]
卷期号:5 (6): 2907-2920 被引量:7
标识
DOI:10.1109/tai.2023.3333827
摘要

Most existing RGB-D salient object detection methods utilize the Convolutional Neural Networks (CNNs) to extract features. However, they fail to extract global information due to the inherent defect of sliding window. On the other hand, with the emergence of depth clues, how to effectively incorporate cross-modal features has become an underlying challenge. In addition, in terms of cross-level feature fusion, most methods do not fully consider the complementarity between different layers and usually adopt simple fusion strategies, thereby leading to the missing of detailed information. To relieve these issues, a Cross-modal and Cross-level Attention Interaction Network (CAINet) is proposed. First, different from most existing methods, we adopt a two-stream Swin Transformers to extract RGB and depth features. Second, a High-level Context Refinement Module (HCRM) is designed to further extract refined features and give accurate guidance in early prediction stage. Third, we design a Cross-modal Interaction Enhancement Module (CIEM) to explore the complementarity of different modalities via co-attention. In terms of fusion for high-level and low-level features in decoding, a Multi-scale Attention Induced Decoder (MAID) is designed to extract and fuse the complementary information at different scales. Finally, the Edge Enhancement Module (EEM) is employed to compensate the dilution of edge. Our proposed CAINet achieves excellent performance compared to other state-of-the-art (SOTA) methods on seven widely used datasets.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
汉堡包应助十一采纳,获得10
1秒前
科研通AI2S应助十一采纳,获得10
1秒前
搜集达人应助十一采纳,获得10
1秒前
水泥应助十一采纳,获得10
1秒前
研友_VZG7GZ应助十一采纳,获得10
1秒前
1秒前
传奇3应助十一采纳,获得10
1秒前
所所应助十一采纳,获得10
1秒前
脑洞疼应助十一采纳,获得10
1秒前
李健的小迷弟应助十一采纳,获得10
2秒前
mnivver发布了新的文献求助10
2秒前
JamesPei应助jinshijie采纳,获得10
4秒前
Sadgenius完成签到,获得积分10
4秒前
量子星尘发布了新的文献求助10
5秒前
5秒前
少7一点8完成签到,获得积分10
5秒前
7秒前
丁论文发布了新的文献求助10
7秒前
Lucas应助小木虫采纳,获得10
9秒前
含蓄洋葱发布了新的文献求助30
9秒前
小二郎应助十一采纳,获得10
10秒前
李健应助十一采纳,获得10
10秒前
思源应助十一采纳,获得10
10秒前
希望天下0贩的0应助十一采纳,获得10
10秒前
Ava应助十一采纳,获得10
10秒前
科研通AI6.1应助十一采纳,获得10
10秒前
10秒前
李健的小迷弟应助十一采纳,获得10
10秒前
Owen应助十一采纳,获得10
10秒前
JamesPei应助十一采纳,获得10
10秒前
11秒前
呆萌羊青发布了新的文献求助10
11秒前
量子星尘发布了新的文献求助10
11秒前
12秒前
研友_8Wz5MZ完成签到,获得积分10
12秒前
nnd完成签到,获得积分10
13秒前
13秒前
14秒前
15秒前
slj发布了新的文献求助10
15秒前
高分求助中
2025-2031全球及中国金刚石触媒粉行业研究及十五五规划分析报告 40000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to strong mixing conditions volume 1-3 5000
Ägyptische Geschichte der 21.–30. Dynastie 2500
Clinical Microbiology Procedures Handbook, Multi-Volume, 5th Edition 2000
„Semitische Wissenschaften“? 1510
从k到英国情人 1500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5742971
求助须知:如何正确求助?哪些是违规求助? 5411694
关于积分的说明 15346421
捐赠科研通 4884001
什么是DOI,文献DOI怎么找? 2625486
邀请新用户注册赠送积分活动 1574345
关于科研通互助平台的介绍 1531262