HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness

计算机科学 人工智能 粒度 RGB颜色模型 保险丝(电气) 突出 情态动词 利用 计算机视觉 模式识别(心理学) 水准点(测量) 目标检测 化学 计算机安全 大地测量学 高分子化学 地理 电气工程 工程类 操作系统
作者
Zongwei Wu,Guillaume Allibert,Fabrice Mériaudeau,Chao Ma,Cédric Demonceaux
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:32: 2160-2173 被引量:37
标识
DOI:10.1109/tip.2023.3263111
摘要

RGB-D saliency detection aims to fuse multi-modal cues to accurately localize salient regions. Existing works often adopt attention modules for feature modeling, with few methods explicitly leveraging fine-grained details to merge with semantic cues. Thus, despite the auxiliary depth information, it is still challenging for existing models to distinguish objects with similar appearances but at distinct camera distances. In this paper, from a new perspective, we propose a novel Hierarchical Depth Awareness network (HiDAnet) for RGB-D saliency detection. Our motivation comes from the observation that the multi-granularity properties of geometric priors correlate well with the neural network hierarchies. To realize multi-modal and multi-level fusion, we first use a granularity-based attention scheme to strengthen the discriminatory power of RGB and depth features separately. Then we introduce a unified cross dual-attention module for multi-modal and multi-level fusion in a coarse-to-fine manner. The encoded multi-modal features are gradually aggregated into a shared decoder. Further, we exploit a multi-scale loss to take full advantage of the hierarchical information. Extensive experiments on challenging benchmark datasets demonstrate that our HiDAnet performs favorably over the state-of-the-art methods by large margins. The source code can be found in https://github.com/Zongwei97/HIDANet/.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
开心若菱发布了新的文献求助10
3秒前
3秒前
2.17;10.13发布了新的文献求助10
4秒前
汉堡包应助迷你的绿竹采纳,获得10
6秒前
万能图书馆应助深秋远塞采纳,获得10
7秒前
烟花应助害羞的沛凝采纳,获得10
7秒前
傲娇衬衫发布了新的文献求助10
7秒前
yy发布了新的文献求助10
8秒前
8秒前
duck0008完成签到,获得积分10
8秒前
10秒前
lmd250909完成签到,获得积分10
10秒前
浪子应助晨雨采纳,获得10
11秒前
11秒前
11秒前
12秒前
duck0008发布了新的文献求助10
12秒前
毕院士发布了新的文献求助30
12秒前
科研通AI6应助发文必过采纳,获得10
13秒前
浮游应助667采纳,获得30
13秒前
Poisomber发布了新的文献求助10
13秒前
14秒前
14秒前
浮游应助心随以动采纳,获得10
15秒前
lmd发布了新的文献求助10
15秒前
16秒前
17秒前
酷波er应助glory0510采纳,获得10
17秒前
傲娇衬衫完成签到,获得积分10
17秒前
善学以致用应助明亮嘉熙采纳,获得10
18秒前
wangchenhong发布了新的文献求助10
18秒前
19秒前
科研通AI6应助开心若菱采纳,获得10
20秒前
CXHY完成签到,获得积分10
20秒前
21秒前
浮游应助顺利的边牧采纳,获得10
21秒前
路振银发布了新的文献求助10
21秒前
21秒前
感动的世倌完成签到,获得积分10
22秒前
高分求助中
Comprehensive Toxicology Fourth Edition 24000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
LRZ Gitlab附件(3D Matching of TerraSAR-X Derived Ground Control Points to Mobile Mapping Data 附件) 2000
World Nuclear Fuel Report: Global Scenarios for Demand and Supply Availability 2025-2040 800
The Social Work Ethics Casebook(2nd,Frederic G. R) 600
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 500
AASHTO LRFD Bridge Design Specifications (10th Edition) with 2025 Errata 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5124930
求助须知:如何正确求助?哪些是违规求助? 4328978
关于积分的说明 13489368
捐赠科研通 4163582
什么是DOI,文献DOI怎么找? 2282431
邀请新用户注册赠送积分活动 1283622
关于科研通互助平台的介绍 1222842