MAGNet: Multi-scale Awareness and Global fusion Network for RGB-D salient object detection

计算机视觉 突出 RGB颜色模型 人工智能 比例(比率) 计算机科学 融合 对象(语法) 地图学 地理 语言学 哲学
作者
M Zhong,Jing Sun,Peng Ren,Fasheng Wang,Fuming Sun
出处
期刊:Knowledge Based Systems [Elsevier BV]
卷期号:299: 112126-112126 被引量:55
标识
DOI:10.1016/j.knosys.2024.112126
摘要

In recent years, excellent RGB-D salient object detection performance has been achieved. However, existing detection methods generally require a large number of model parameters in pursuit of high accuracy. To alleviate this problem, we propose a Multi-scale Awareness and Global fusion Network for RGB-D salient object detection, named MAGNet. MAGNet has 16.1M Params and 9.9G FLOPs. Specifically, we notice that convolutional neural networks (CNNs) can strongly perceive local spatial structures, whereas attention mechanisms can perform global correlation analysis of input information. Therefore, we exploit the advantages of both methods to design two kinds of cross-modal feature fusion modules. To reduce the computational complexity of the model, we design a multi-scale awareness fusion module (MAFM) to fully leverage the rich textural information and edge information in low-level feature maps. For the high-level feature maps, we incorporate an attention mechanism and a CNN to design a global fusion module (GFM), which enables the model to better capture the semantic information of different modalities by learning the correspondence between RGB and depth images. Then, we employ the proposed multi-level convolution module (MCM) to generate the predicted map through a step-by-step decoding process, which can gradually recover finer detection results. Finally, extensive experimental results on six datasets show that the proposed MAGNet not only achieves advanced detection performance but also drastically reduces the number of model parameters. Source code is available at https://github.com/mingyu6346/MAGNet.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小油菜完成签到,获得积分10
刚刚
刚刚
qiu发布了新的文献求助10
刚刚
刚刚
Crazyjmj完成签到,获得积分10
1秒前
1秒前
SciGPT应助陌珩灏采纳,获得30
1秒前
1秒前
QH发布了新的文献求助10
2秒前
Dre4m_Z发布了新的文献求助20
3秒前
千千完成签到,获得积分10
4秒前
CipherSage应助KD采纳,获得10
4秒前
5秒前
尖叫番茄完成签到,获得积分10
5秒前
zygyydr应助vw采纳,获得10
5秒前
小米渣完成签到,获得积分10
5秒前
沐木发布了新的文献求助10
5秒前
小油菜发布了新的文献求助10
6秒前
不知为不知完成签到,获得积分10
7秒前
7秒前
刘歌完成签到 ,获得积分10
8秒前
9秒前
jojo完成签到 ,获得积分10
9秒前
9秒前
eeeee发布了新的文献求助10
11秒前
大模型应助yuchuncheng采纳,获得10
12秒前
轩辕断天完成签到,获得积分10
12秒前
漂亮孤兰发布了新的文献求助10
12秒前
jie完成签到,获得积分10
13秒前
苻一手完成签到 ,获得积分10
13秒前
14秒前
遇见完成签到,获得积分10
14秒前
Jaydon完成签到,获得积分10
14秒前
星辰大海应助Okeah采纳,获得10
15秒前
wenjing完成签到 ,获得积分10
15秒前
15秒前
Owen应助0111采纳,获得10
16秒前
16秒前
molihuakai应助科研通管家采纳,获得10
16秒前
16秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to Helicopter and Tiltrotor Flight Simulation, Second Edition 2500
卤化钙钛矿人工突触的研究 2000
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Software that combines deep learning,3D reconstruction and CFD to analyze the state of carotid arteries from ultrasound imaging 600
Bounds for Statistical Estimation in Semiparametric Models 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6500347
求助须知:如何正确求助?哪些是违规求助? 8295538
关于积分的说明 17703875
捐赠科研通 5597108
什么是DOI,文献DOI怎么找? 2918328
邀请新用户注册赠送积分活动 1895367
关于科研通互助平台的介绍 1756283