Collaborative compensative transformer network for salient object detection

突出 计算机科学 人工智能 目标检测 计算机视觉 水准点(测量) 特征(语言学) 背景(考古学) 上下文模型 对象(语法) 模式识别(心理学) 哲学 古生物学 生物 地理 语言学 大地测量学
作者
Jun Chen,Heye Zhang,Mingming Gong,Zhifan Gao
出处
期刊:Pattern Recognition [Elsevier]
卷期号:154: 110600-110600 被引量:25
标识
DOI:10.1016/j.patcog.2024.110600
摘要

Salient object detection (SOD) is of high significance for various computer vision applications but is a challenging task due to the complicated scenes in real-world images. Most state-of-the-art SOD methods aim to build long-range dependency for improving global contrast modeling in complicated scenes. However, most of them suffer from the prior assumption of treating image patches as visual tokens for building long-range dependency. This is because this assumption leads to localizing salient regions with uncertain boundaries due to the lost object structure information. In this paper, to address this issue, we re-construct the prior assumption of treating both patches and superpixels as visual tokens for building long-range dependency, which takes into account the properties of superpixels and patches in preserving detailed structural-aware information and local context information, respectively. Based on the re-constructed prior assumption, we propose a Collaborative Compensative Transformer Network (CCTNet) for the SOD task. CCTNet firstly alternates the computation within the same kind of vision tokens and among different vision tokens to build their dependencies. By this means, the relationship between multi-level global context and detailed structure representation can be explicitly modeled for consistent semantic and object structure understanding. Then, CCTNet performs feature joint decoding for SOD by fusing the complementary global context and detailed structure for locating objects with certain boundaries. Extensive experiments were conducted to validate the effectiveness of the proposed modules. Furthermore, the experiments on ten benchmark datasets demonstrated the state-of-the-art performance of CCTNet on both RGB and RGB-D SOD.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
Robin完成签到,获得积分10
4秒前
武雨寒发布了新的文献求助10
6秒前
zhuxd完成签到 ,获得积分10
6秒前
包容明辉完成签到 ,获得积分10
9秒前
小HO完成签到 ,获得积分10
10秒前
jin完成签到,获得积分10
16秒前
16秒前
科研通AI2S应助科研通管家采纳,获得10
16秒前
传奇3应助科研通管家采纳,获得10
16秒前
量子星尘发布了新的文献求助10
17秒前
18秒前
勤奋丸子完成签到 ,获得积分10
25秒前
优雅的帅哥完成签到 ,获得积分10
25秒前
28秒前
量子星尘发布了新的文献求助10
31秒前
serenity711完成签到 ,获得积分10
31秒前
Jeffery426完成签到,获得积分10
33秒前
wangji_2017完成签到,获得积分10
38秒前
就好完成签到 ,获得积分10
38秒前
量子星尘发布了新的文献求助10
41秒前
认真丹亦完成签到 ,获得积分10
42秒前
禾页完成签到 ,获得积分10
43秒前
飞儿完成签到 ,获得积分10
47秒前
liangguangyuan完成签到 ,获得积分10
47秒前
俏皮诺言完成签到,获得积分10
50秒前
量子星尘发布了新的文献求助10
51秒前
神勇寒天完成签到 ,获得积分10
51秒前
李帅完成签到,获得积分10
51秒前
量子星尘发布了新的文献求助10
56秒前
58秒前
顺心寄容完成签到,获得积分10
59秒前
1分钟前
yicui发布了新的文献求助10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
朱洪帆发布了新的文献求助10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
CYT完成签到,获得积分10
1分钟前
华仔应助yicui采纳,获得10
1分钟前
wol007完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Binary Alloy Phase Diagrams, 2nd Edition 8000
A Practical Introduction to Regression Discontinuity Designs 2000
Comprehensive Methanol Science Production, Applications, and Emerging Technologies 2000
Building Quantum Computers 800
Translanguaging in Action in English-Medium Classrooms: A Resource Book for Teachers 700
二氧化碳加氢催化剂——结构设计与反应机制研究 660
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5658456
求助须知:如何正确求助?哪些是违规求助? 4821768
关于积分的说明 15081508
捐赠科研通 4816942
什么是DOI,文献DOI怎么找? 2577824
邀请新用户注册赠送积分活动 1532666
关于科研通互助平台的介绍 1491364