CLIP-Branches: Interactive Fine-Tuning for Text-Image Retrieval

计算机科学 图像(数学) 情报检索 计算机视觉 计算机图形学(图像) 人工智能
作者
Christian Lülf,Denis Mayr Lima Martins,Marcos Antonio Vaz Salles,Yongluan Zhou,Fabian Gieseke
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2406.13322
摘要

The advent of text-image models, most notably CLIP, has significantly transformed the landscape of information retrieval. These models enable the fusion of various modalities, such as text and images. One significant outcome of CLIP is its capability to allow users to search for images using text as a query, as well as vice versa. This is achieved via a joint embedding of images and text data that can, for instance, be used to search for similar items. Despite efficient query processing techniques such as approximate nearest neighbor search, the results may lack precision and completeness. We introduce CLIP-Branches, a novel text-image search engine built upon the CLIP architecture. Our approach enhances traditional text-image search engines by incorporating an interactive fine-tuning phase, which allows the user to further concretize the search query by iteratively defining positive and negative examples. Our framework involves training a classification model given the additional user feedback and essentially outputs all positively classified instances of the entire data catalog. By building upon recent techniques, this inference phase, however, is not implemented by scanning the entire data catalog, but by employing efficient index structures pre-built for the data. Our results show that the fine-tuned results can improve the initial search outputs in terms of relevance and accuracy while maintaining swift response times

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
范白容完成签到 ,获得积分0
刚刚
然而。完成签到 ,获得积分10
1秒前
2秒前
乘舟江行完成签到,获得积分10
5秒前
静一会发布了新的文献求助10
6秒前
超帅的又槐完成签到,获得积分10
8秒前
踏实谷蓝完成签到 ,获得积分10
10秒前
阿欢完成签到 ,获得积分10
13秒前
zzzzzzz完成签到 ,获得积分10
17秒前
sdbz001完成签到,获得积分10
18秒前
上下完成签到 ,获得积分10
18秒前
肥而不腻的羚羊完成签到,获得积分10
19秒前
SciGPT应助夏傥采纳,获得10
19秒前
BruceKKKK完成签到,获得积分10
20秒前
典雅天薇完成签到,获得积分10
20秒前
希望天下0贩的0应助QIN采纳,获得10
21秒前
TTK完成签到,获得积分10
26秒前
丘比特应助科研通管家采纳,获得10
28秒前
斯文败类应助科研通管家采纳,获得10
28秒前
CipherSage应助科研通管家采纳,获得10
28秒前
FashionBoy应助科研通管家采纳,获得10
28秒前
余鹰完成签到,获得积分10
28秒前
liyanglin完成签到 ,获得积分10
30秒前
心碎的黄焖鸡完成签到 ,获得积分10
32秒前
夏傥发布了新的文献求助10
33秒前
不敢装睡完成签到,获得积分10
34秒前
科研通AI2S应助风信子deon01采纳,获得10
35秒前
昏睡的乌冬面完成签到 ,获得积分10
36秒前
Karry完成签到 ,获得积分10
37秒前
一只菜鸟完成签到 ,获得积分10
38秒前
欣喜的跳跳糖完成签到 ,获得积分10
39秒前
芒果布丁完成签到 ,获得积分10
40秒前
凉梦完成签到,获得积分20
41秒前
42秒前
向日葵完成签到,获得积分10
44秒前
肉片牛帅帅完成签到,获得积分10
44秒前
是白鸽啊完成签到 ,获得积分10
47秒前
科研通AI5应助静一会采纳,获得10
48秒前
答辩科学家完成签到,获得积分10
48秒前
领导范儿应助Rainbow采纳,获得10
49秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Conference Record, IAS Annual Meeting 1977 820
England and the Discovery of America, 1481-1620 600
Fault identification method of electrical automation distribution equipment in distribution networks based on neural network 560
Teaching language in context (Third edition) by Derewianka, Beverly; Jones, Pauline 550
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3580488
求助须知:如何正确求助?哪些是违规求助? 3150008
关于积分的说明 9479682
捐赠科研通 2851531
什么是DOI,文献DOI怎么找? 1567864
邀请新用户注册赠送积分活动 734254
科研通“疑难数据库(出版商)”最低求助积分说明 720579