TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised Object Localization

计算机科学 人工智能 判别式 模式识别(心理学) 卷积神经网络 安全性令牌 语义学(计算机科学) 对象(语法) 依赖关系(UML) 特征提取 特征(语言学) 计算机视觉 自然语言处理 计算机安全 程序设计语言 语言学 哲学
作者
Wei Gao,Fang Wan,Xingjia Pan,Zhiliang Peng,Qi Tian,Zhenjun Han,Bolei Zhou,Qixiang Ye
标识
DOI:10.1109/iccv48922.2021.00288
摘要

Weakly supervised object localization (WSOL) is a challenging problem when given image category labels but requires to learn object localization models. Optimizing a convolutional neural network (CNN) for classification tends to activate local discriminative regions while ignoring complete object extent, causing the partial activation issue. In this paper, we argue that partial activation is caused by the intrinsic characteristics of CNN, where the convolution operations produce local receptive fields and experience difficulty to capture long-range feature dependency among pixels. We introduce the token semantic coupled attention map (TS-CAM) to take full advantage of the self-attention mechanism in visual transformer for long-range dependency extraction. TS-CAM first splits an image into a sequence of patch tokens for spatial embedding, which produce attention maps of long-range visual dependency to avoid partial activation. TS-CAM then re-allocates category-related semantics for patch tokens, enabling each of them to be aware of object categories. TS-CAM finally couples the patch tokens with the semantic-agnostic attention map to achieve semantic-aware localization. Experiments on the ILSVRC/CUB-200-2011 datasets show that TS-CAM outperforms its CNN-CAM counterparts by 7.1%/27.1% for WSOL, achieving state-of-the-art performance. Code is available at https://github.com/vasgaowei/TS-CAM

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
潜龙完成签到 ,获得积分10
1秒前
o椰完成签到 ,获得积分10
1秒前
i2stay完成签到,获得积分0
1秒前
方方完成签到 ,获得积分10
8秒前
王哇噻完成签到 ,获得积分10
8秒前
小HO完成签到 ,获得积分10
9秒前
blusky完成签到,获得积分10
10秒前
李登昆完成签到 ,获得积分10
10秒前
空空道人发布了新的文献求助10
11秒前
兰战非完成签到 ,获得积分10
12秒前
liaomr完成签到 ,获得积分10
15秒前
简爱完成签到 ,获得积分10
15秒前
20秒前
香芋完成签到 ,获得积分10
21秒前
蓝色花生豆完成签到,获得积分0
21秒前
22秒前
阳光保温杯完成签到 ,获得积分10
23秒前
酷波er应助大气藏今采纳,获得10
24秒前
满意的妙海完成签到 ,获得积分10
28秒前
xmqaq完成签到,获得积分10
28秒前
爱喝佳得乐完成签到,获得积分10
32秒前
舒服的婷冉完成签到 ,获得积分10
33秒前
jason完成签到 ,获得积分10
35秒前
郭元强完成签到,获得积分10
39秒前
东农dhl完成签到 ,获得积分10
43秒前
欧阳娜娜完成签到 ,获得积分10
44秒前
叶远望完成签到 ,获得积分10
46秒前
菜鸟学习完成签到 ,获得积分10
48秒前
48秒前
申燕婷完成签到 ,获得积分10
52秒前
大气藏今发布了新的文献求助10
52秒前
小二郎应助zzy采纳,获得10
53秒前
clm完成签到 ,获得积分10
56秒前
轻松的越彬完成签到 ,获得积分10
56秒前
小唐完成签到,获得积分10
56秒前
57秒前
1分钟前
1分钟前
1分钟前
tangli完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
T/SNFSOC 0002—2025 独居石精矿碱法冶炼工艺技术标准 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6043109
求助须知:如何正确求助?哪些是违规求助? 7802498
关于积分的说明 16237910
捐赠科研通 5188612
什么是DOI,文献DOI怎么找? 2776637
邀请新用户注册赠送积分活动 1759682
关于科研通互助平台的介绍 1643238