SuS-X: Training-Free Name-Only Transfer of Vision-Language Models

计算机科学 杠杆(统计) 语言模型 学习迁移 任务(项目管理) 水准点(测量) 人工智能 训练集 传输(计算) 弹丸 钥匙(锁) 编码(集合论) 自然语言处理 机器学习 程序设计语言 并行计算 化学 计算机安全 管理 大地测量学 有机化学 集合(抽象数据类型) 经济 地理
作者
Vishaal Udandarao,Ankush Gupta,Samuel Albanie
标识
DOI:10.1109/iccv51070.2023.00257
摘要

Contrastive Language-Image Pre-training (CLIP) has emerged as a simple yet effective way to train large-scale vision-language models. CLIP demonstrates impressive zero-shot classification and retrieval performance on diverse downstream tasks. However, to leverage its full potential, fine-tuning still appears to be necessary. Fine-tuning the entire CLIP model can be resource-intensive and unstable. Moreover, recent methods that aim to circumvent this need for fine-tuning still require access to images from the target task distribution. In this paper, we pursue a different approach and explore the regime of training-free "name-only transfer" in which the only knowledge we possess about the downstream task comprises the names of downstream target categories. We propose a novel method, SuS-X, consisting of two key building blocks— "SuS" and "TIP-X", that requires neither intensive fine-tuning nor costly labelled data. SuS-X achieves state-of-the-art (SoTA) zero-shot classification results on 19 benchmark datasets. We further show the utility of TIP-X in the training-free few-shot setting, where we again achieve SoTA results over strong training-free baselines. Code is available at https://github.com/vishaal27/SuS-X.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
刚刚
2123121321321发布了新的文献求助10
1秒前
马美丽发布了新的文献求助10
1秒前
浮游应助落寞的易绿采纳,获得10
2秒前
Guhuiying发布了新的文献求助30
2秒前
调皮盼烟发布了新的文献求助10
3秒前
思源应助千寻采纳,获得10
3秒前
胡晓平完成签到,获得积分10
3秒前
3秒前
华仔应助1238125446采纳,获得10
3秒前
庚子鼠完成签到,获得积分10
4秒前
李健应助王大爷采纳,获得10
4秒前
vivian完成签到 ,获得积分10
4秒前
老阎应助花花采纳,获得30
4秒前
tianyy完成签到,获得积分10
4秒前
5秒前
研友_LOqqmZ发布了新的文献求助10
5秒前
5秒前
6秒前
6秒前
天天快乐应助迷路严青采纳,获得10
7秒前
8秒前
11秒前
Haha发布了新的文献求助10
11秒前
sunshine完成签到,获得积分10
11秒前
小斌完成签到,获得积分10
12秒前
量子星尘发布了新的文献求助10
12秒前
azen发布了新的文献求助10
12秒前
充电宝应助张凌志采纳,获得10
12秒前
小y发布了新的文献求助10
13秒前
Akim应助顺顺尼采纳,获得10
13秒前
wanci应助clp采纳,获得10
14秒前
在水一方应助张学友采纳,获得10
14秒前
Placebo关注了科研通微信公众号
14秒前
无花果应助研友_ZeoKYL采纳,获得10
14秒前
麦克尔完成签到,获得积分10
14秒前
顾瑞关注了科研通微信公众号
14秒前
搜集达人应助pkaq采纳,获得10
15秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Einführung in die Rechtsphilosophie und Rechtstheorie der Gegenwart 1500
NMR in Plants and Soils: New Developments in Time-domain NMR and Imaging 600
Electrochemistry: Volume 17 600
La cage des méridiens. La littérature et l’art contemporain face à la globalisation 577
Practical Invisalign Mechanics: Crowding 500
Practical Invisalign Mechanics: Deep Bite and Class II Correction 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4954783
求助须知:如何正确求助?哪些是违规求助? 4217083
关于积分的说明 13122349
捐赠科研通 3999304
什么是DOI,文献DOI怎么找? 2188752
邀请新用户注册赠送积分活动 1203861
关于科研通互助平台的介绍 1116143