已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

MAGNet: Multi-scale Awareness and Global fusion Network for RGB-D salient object detection

计算机视觉 突出 RGB颜色模型 人工智能 比例(比率) 计算机科学 融合 对象(语法) 地图学 地理 语言学 哲学
作者
M Zhong,Jing Sun,Peng Ren,Fasheng Wang,Fuming Sun
出处
期刊:Knowledge Based Systems [Elsevier BV]
卷期号:299: 112126-112126 被引量:35
标识
DOI:10.1016/j.knosys.2024.112126
摘要

In recent years, excellent RGB-D salient object detection performance has been achieved. However, existing detection methods generally require a large number of model parameters in pursuit of high accuracy. To alleviate this problem, we propose a Multi-scale Awareness and Global fusion Network for RGB-D salient object detection, named MAGNet. MAGNet has 16.1M Params and 9.9G FLOPs. Specifically, we notice that convolutional neural networks (CNNs) can strongly perceive local spatial structures, whereas attention mechanisms can perform global correlation analysis of input information. Therefore, we exploit the advantages of both methods to design two kinds of cross-modal feature fusion modules. To reduce the computational complexity of the model, we design a multi-scale awareness fusion module (MAFM) to fully leverage the rich textural information and edge information in low-level feature maps. For the high-level feature maps, we incorporate an attention mechanism and a CNN to design a global fusion module (GFM), which enables the model to better capture the semantic information of different modalities by learning the correspondence between RGB and depth images. Then, we employ the proposed multi-level convolution module (MCM) to generate the predicted map through a step-by-step decoding process, which can gradually recover finer detection results. Finally, extensive experimental results on six datasets show that the proposed MAGNet not only achieves advanced detection performance but also drastically reduces the number of model parameters. Source code is available at https://github.com/mingyu6346/MAGNet.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
机灵书易发布了新的文献求助10
1秒前
2秒前
4秒前
情怀应助kiki采纳,获得10
4秒前
6秒前
6秒前
6秒前
暗号发布了新的文献求助10
9秒前
刘述发布了新的文献求助10
10秒前
zln发布了新的文献求助10
12秒前
香蕉觅云应助jzw采纳,获得10
13秒前
龙井茶发布了新的文献求助30
13秒前
小木得霖发布了新的文献求助10
13秒前
Lisa4mamba完成签到,获得积分10
13秒前
桐桐应助任性的皮皮虾采纳,获得10
14秒前
15秒前
15秒前
Eric完成签到,获得积分10
16秒前
17秒前
17秒前
17秒前
完美世界应助Lisa4mamba采纳,获得10
18秒前
刘述完成签到,获得积分10
20秒前
20秒前
acihk发布了新的文献求助10
21秒前
天天快乐应助暗号采纳,获得10
21秒前
21秒前
li完成签到,获得积分10
22秒前
yywd发布了新的文献求助30
23秒前
Lisa4mamba给Lisa4mamba的求助进行了留言
24秒前
25秒前
jzw发布了新的文献求助10
26秒前
26秒前
爆米花应助acihk采纳,获得10
27秒前
29秒前
老王发布了新的文献求助10
29秒前
runner发布了新的文献求助10
30秒前
12332145678完成签到,获得积分10
30秒前
大力的灵雁应助PP采纳,获得10
31秒前
科研通AI6.4应助学业繁忙采纳,获得10
31秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Polymorphism and polytypism in crystals 1000
Relation between chemical structure and local anesthetic action: tertiary alkylamine derivatives of diphenylhydantoin 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Principles of town planning : translating concepts to applications 500
Synthesis of Human Milk Oligosaccharides: 2'- and 3'-Fucosyllactose 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6073113
求助须知:如何正确求助?哪些是违规求助? 7904396
关于积分的说明 16344469
捐赠科研通 5212534
什么是DOI,文献DOI怎么找? 2787951
邀请新用户注册赠送积分活动 1770716
关于科研通互助平台的介绍 1648212