Cross-modal and Cross-level Attention Interaction Network for Salient Object Detection

计算机科学 保险丝(电气) 人工智能 RGB颜色模型 互补性(分子生物学) 情态动词 卷积神经网络 模式识别(心理学) 成对比较 工程类 遗传学 生物 电气工程 化学 高分子化学
作者
Fasheng Wang,Yiming Su,Ruimin Wang,Jing Sun,Fuming Sun,Haojie Li
出处
期刊:IEEE transactions on artificial intelligence [Institute of Electrical and Electronics Engineers]
卷期号:: 1-15 被引量:5
标识
DOI:10.1109/tai.2023.3333827
摘要

Most existing RGB-D salient object detection methods utilize the Convolutional Neural Networks (CNNs) to extract features. However, they fail to extract global information due to the inherent defect of sliding window. On the other hand, with the emergence of depth clues, how to effectively incorporate cross-modal features has become an underlying challenge. In addition, in terms of cross-level feature fusion, most methods do not fully consider the complementarity between different layers and usually adopt simple fusion strategies, thereby leading to the missing of detailed information. To relieve these issues, a Cross-modal and Cross-level Attention Interaction Network (CAINet) is proposed. First, different from most existing methods, we adopt a two-stream Swin Transformers to extract RGB and depth features. Second, a High-level Context Refinement Module (HCRM) is designed to further extract refined features and give accurate guidance in early prediction stage. Third, we design a Cross-modal Interaction Enhancement Module (CIEM) to explore the complementarity of different modalities via co-attention. In terms of fusion for high-level and low-level features in decoding, a Multi-scale Attention Induced Decoder (MAID) is designed to extract and fuse the complementary information at different scales. Finally, the Edge Enhancement Module (EEM) is employed to compensate the dilution of edge. Our proposed CAINet achieves excellent performance compared to other state-of-the-art (SOTA) methods on seven widely used datasets.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
罗拉完成签到,获得积分10
2秒前
4秒前
泌尿邓完成签到,获得积分10
4秒前
Akim应助靓丽的飞槐采纳,获得10
5秒前
6秒前
夜谈十记应助文件撤销了驳回
7秒前
默默洋葱发布了新的文献求助10
9秒前
天天快乐应助silence采纳,获得10
10秒前
Singularity应助约翰威克采纳,获得10
11秒前
12秒前
yuki完成签到,获得积分10
14秒前
天天快乐应助lyb采纳,获得10
19秒前
20秒前
杨优秀完成签到,获得积分10
21秒前
Duolalala完成签到,获得积分20
23秒前
开朗的戎发布了新的文献求助10
24秒前
25秒前
25秒前
25秒前
lycbbgh发布了新的文献求助10
26秒前
Duolalala发布了新的文献求助10
28秒前
小落发布了新的文献求助10
29秒前
研友_gnvY5L发布了新的文献求助10
29秒前
科研通AI2S应助wuwuwu1wu采纳,获得10
30秒前
asd发布了新的文献求助10
30秒前
哈哈完成签到,获得积分10
31秒前
破晓发布了新的文献求助10
31秒前
跳跃野狼发布了新的文献求助10
32秒前
34秒前
39秒前
42秒前
45秒前
共享精神应助Shuning采纳,获得10
45秒前
李健应助yujie采纳,获得10
46秒前
47秒前
49秒前
50秒前
Yy发布了新的文献求助30
52秒前
53秒前
高分求助中
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 888
Le dégorgement réflexe des Acridiens 800
Defense against predation 800
Very-high-order BVD Schemes Using β-variable THINC Method 568
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3136697
求助须知:如何正确求助?哪些是违规求助? 2787724
关于积分的说明 7782985
捐赠科研通 2443808
什么是DOI,文献DOI怎么找? 1299415
科研通“疑难数据库(出版商)”最低求助积分说明 625444
版权声明 600954