TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised Object Localization

计算机科学 人工智能 判别式 模式识别(心理学) 卷积神经网络 安全性令牌 语义学(计算机科学) 对象(语法) 依赖关系(UML) 特征提取 特征(语言学) 计算机视觉 自然语言处理 计算机安全 程序设计语言 语言学 哲学
作者
Wei Gao,Fang Wan,Xingjia Pan,Zhiliang Peng,Qi Tian,Zhenjun Han,Bolei Zhou,Qixiang Ye
标识
DOI:10.1109/iccv48922.2021.00288
摘要

Weakly supervised object localization (WSOL) is a challenging problem when given image category labels but requires to learn object localization models. Optimizing a convolutional neural network (CNN) for classification tends to activate local discriminative regions while ignoring complete object extent, causing the partial activation issue. In this paper, we argue that partial activation is caused by the intrinsic characteristics of CNN, where the convolution operations produce local receptive fields and experience difficulty to capture long-range feature dependency among pixels. We introduce the token semantic coupled attention map (TS-CAM) to take full advantage of the self-attention mechanism in visual transformer for long-range dependency extraction. TS-CAM first splits an image into a sequence of patch tokens for spatial embedding, which produce attention maps of long-range visual dependency to avoid partial activation. TS-CAM then re-allocates category-related semantics for patch tokens, enabling each of them to be aware of object categories. TS-CAM finally couples the patch tokens with the semantic-agnostic attention map to achieve semantic-aware localization. Experiments on the ILSVRC/CUB-200-2011 datasets show that TS-CAM outperforms its CNN-CAM counterparts by 7.1%/27.1% for WSOL, achieving state-of-the-art performance. Code is available at https://github.com/vasgaowei/TS-CAM

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
畅快的胡萝卜完成签到,获得积分10
2秒前
科研通AI6.3应助gshaoooo采纳,获得10
2秒前
刘威完成签到,获得积分10
3秒前
研友_nvggxZ完成签到,获得积分10
4秒前
AO完成签到,获得积分10
4秒前
yuyu完成签到,获得积分10
4秒前
咸蛋黄味曲奇完成签到,获得积分10
4秒前
精明凡雁完成签到,获得积分10
4秒前
qiqi完成签到,获得积分10
5秒前
丽莫莫完成签到,获得积分10
5秒前
无花果应助烯灯采纳,获得10
5秒前
审核中完成签到,获得积分10
6秒前
淡然的糖豆完成签到 ,获得积分10
6秒前
儒雅谷芹完成签到,获得积分10
6秒前
小通通完成签到 ,获得积分10
6秒前
xz完成签到 ,获得积分10
6秒前
大豆终结者完成签到,获得积分10
7秒前
wh完成签到,获得积分10
7秒前
要减肥香水完成签到,获得积分10
7秒前
不弱小妖完成签到,获得积分10
7秒前
李子园完成签到 ,获得积分10
8秒前
宝藏完成签到,获得积分10
8秒前
专一的访文完成签到,获得积分10
8秒前
MW完成签到,获得积分10
9秒前
XXX_Y完成签到,获得积分10
9秒前
ldy完成签到,获得积分10
10秒前
10秒前
MiRoRo完成签到 ,获得积分10
10秒前
暮夕梧桐完成签到,获得积分10
11秒前
科研通AI6.3应助11111采纳,获得10
11秒前
山野村夫完成签到,获得积分10
11秒前
忐忑的书桃完成签到 ,获得积分10
11秒前
12秒前
12秒前
13秒前
花花完成签到,获得积分10
13秒前
BowieHuang应助蝃蝀采纳,获得10
13秒前
房天川发布了新的文献求助30
13秒前
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
T/SNFSOC 0002—2025 独居石精矿碱法冶炼工艺技术标准 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6043220
求助须知:如何正确求助?哪些是违规求助? 7804296
关于积分的说明 16238465
捐赠科研通 5188762
什么是DOI,文献DOI怎么找? 2776731
邀请新用户注册赠送积分活动 1759767
关于科研通互助平台的介绍 1643316