亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Improving Visual Object Tracking through Visual Prompting

计算机视觉 计算机科学 对象(语法) 人工智能 眼动 跟踪(教育) 视频跟踪 计算机图形学(图像) 心理学 教育学
作者
Shih-Fang Chen,Juncheng Chen,I‐Hong Jhuo,Yen‐Yu Lin
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2409.18901
摘要

Learning a discriminative model to distinguish a target from its surrounding distractors is essential to generic visual object tracking. Dynamic target representation adaptation against distractors is challenging due to the limited discriminative capabilities of prevailing trackers. We present a new visual Prompting mechanism for generic Visual Object Tracking (PiVOT) to address this issue. PiVOT proposes a prompt generation network with the pre-trained foundation model CLIP to automatically generate and refine visual prompts, enabling the transfer of foundation model knowledge for tracking. While CLIP offers broad category-level knowledge, the tracker, trained on instance-specific data, excels at recognizing unique object instances. Thus, PiVOT first compiles a visual prompt highlighting potential target locations. To transfer the knowledge of CLIP to the tracker, PiVOT leverages CLIP to refine the visual prompt based on the similarities between candidate objects and the reference templates across potential targets. Once the visual prompt is refined, it can better highlight potential target locations, thereby reducing irrelevant prompt information. With the proposed prompting mechanism, the tracker can generate improved instance-aware feature maps through the guidance of the visual prompt, thus effectively reducing distractors. The proposed method does not involve CLIP during training, thereby keeping the same training complexity and preserving the generalization capability of the pretrained foundation model. Extensive experiments across multiple benchmarks indicate that PiVOT, using the proposed prompting method can suppress distracting objects and enhance the tracker.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
朴素的山蝶完成签到 ,获得积分10
9秒前
彭于晏应助Yantuobio采纳,获得10
17秒前
mirrovo完成签到 ,获得积分10
21秒前
springovo发布了新的文献求助10
25秒前
32秒前
yin发布了新的文献求助30
36秒前
认真代曼发布了新的文献求助10
39秒前
Hello应助南风采纳,获得10
40秒前
水若琳完成签到,获得积分10
44秒前
关我屁事完成签到 ,获得积分10
47秒前
51秒前
51秒前
南风发布了新的文献求助10
55秒前
55秒前
平常万言完成签到 ,获得积分10
56秒前
hhhhh完成签到 ,获得积分10
1分钟前
1分钟前
Perion完成签到 ,获得积分10
1分钟前
llooookk完成签到 ,获得积分10
1分钟前
乐乐应助Xin采纳,获得10
1分钟前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
CodeCraft应助科研通管家采纳,获得10
1分钟前
Akim应助科研通管家采纳,获得10
1分钟前
yin完成签到,获得积分10
1分钟前
lby完成签到 ,获得积分10
1分钟前
HilbertVon完成签到 ,获得积分10
2分钟前
阿鑫完成签到 ,获得积分10
2分钟前
务实书包完成签到,获得积分10
2分钟前
2分钟前
2分钟前
Yantuobio完成签到,获得积分10
2分钟前
2分钟前
constance_s完成签到 ,获得积分10
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
专注的曼卉完成签到 ,获得积分10
2分钟前
2分钟前
2分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 3000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
T/CAB 0344-2024 重组人源化胶原蛋白内毒素去除方法 1000
Maneuvering of a Damaged Navy Combatant 650
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3775864
求助须知:如何正确求助?哪些是违规求助? 3321496
关于积分的说明 10205814
捐赠科研通 3036564
什么是DOI,文献DOI怎么找? 1666324
邀请新用户注册赠送积分活动 797334
科研通“疑难数据库(出版商)”最低求助积分说明 757797