Visual Prompt Multi-Modal Tracking

计算机科学 情态动词 RGB颜色模型 人工智能 跟踪(教育) 计算机视觉 下游(制造业) 眼动 事件(粒子物理) 机器学习 工程类 心理学 教育学 化学 运营管理 物理 量子力学 高分子化学
作者
Jiawen Zhu,Simiao Lai,Xin Chen,Dong Wang,Huchuan Lu
标识
DOI:10.1109/cvpr52729.2023.00918
摘要

Visible-modal object tracking gives rise to a series of downstream multi-modal tracking tributaries. To inherit the powerful representations of the foundation model, a natural modus operandi for multi-modal tracking is full fine-tuning on the RGB-based parameters. Albeit effective, this manner is not optimal due to the scarcity of downstream data and poor transferability, etc. In this paper, inspired by the recent success of the prompt learning in language models, we develop Visual Prompt multi-modal Tracking (ViPT), which learns the modal-relevant prompts to adapt the frozen pre-trained foundation model to various downstream multi-modal tracking tasks. ViPT finds a better way to stimulate the knowledge of the RGB-based model that is pre-trained at scale, meanwhile only introducing a few trainable parameters (less than 1% of model parameters). ViPT outperforms the full fine-tuning paradigm on multiple downstream tracking tasks including RGB+Depth, RGB+Thermal, and RGB+Event tracking. Extensive experiments show the potential of visual prompt learning for multi-modal tracking, and ViPT can achieve state-of-the-art performance while satisfying parameter efficiency. Code and models are available at https://github.com/jiawen-zhu/ViPT.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
i-bear完成签到,获得积分10
1秒前
帅气的祥发布了新的文献求助10
1秒前
归诚发布了新的文献求助10
1秒前
费尔明娜完成签到,获得积分10
2秒前
火星上盼山完成签到 ,获得积分10
2秒前
Akim应助科研白小白采纳,获得10
4秒前
iNk应助迷你的水绿采纳,获得20
4秒前
自由的厉完成签到 ,获得积分10
6秒前
李嘉琪发布了新的文献求助10
6秒前
充电宝应助zhangsudi采纳,获得10
6秒前
星辰大海应助小手冰冰凉采纳,获得10
6秒前
远了个方发布了新的文献求助20
8秒前
温馨完成签到 ,获得积分10
9秒前
英俊一刀完成签到,获得积分10
9秒前
9秒前
小太阳完成签到,获得积分10
9秒前
10秒前
舒心的青槐完成签到 ,获得积分10
12秒前
卷清完成签到,获得积分10
12秒前
StarChen发布了新的文献求助20
12秒前
hmfyl完成签到,获得积分10
13秒前
fighting完成签到 ,获得积分10
13秒前
无限毛豆完成签到 ,获得积分10
14秒前
15秒前
15秒前
momo发布了新的文献求助10
16秒前
16秒前
蔺天宇完成签到,获得积分10
16秒前
雁塔完成签到 ,获得积分10
18秒前
Owen应助无妄海采纳,获得10
20秒前
zhangsudi发布了新的文献求助10
20秒前
自然的宝贝完成签到,获得积分10
20秒前
Lz完成签到,获得积分10
21秒前
只道寻常完成签到,获得积分10
21秒前
贪玩黑米应助金国小王爷采纳,获得10
21秒前
归诚发布了新的文献求助10
21秒前
22秒前
科研白小白完成签到,获得积分10
22秒前
25秒前
高分求助中
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 1000
지식생태학: 생태학, 죽은 지식을 깨우다 600
Mantodea of the World: Species Catalog Andrew M 500
海南省蛇咬伤流行病学特征与预后影响因素分析 500
Neuromuscular and Electrodiagnostic Medicine Board Review 500
ランス多機能化技術による溶鋼脱ガス処理の高効率化の研究 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3464070
求助须知:如何正确求助?哪些是违规求助? 3057259
关于积分的说明 9056694
捐赠科研通 2747427
什么是DOI,文献DOI怎么找? 1507362
科研通“疑难数据库(出版商)”最低求助积分说明 696491
邀请新用户注册赠送积分活动 696004