亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Dense Text Retrieval Based on Pretrained Language Models: A Survey

计算机科学 情报检索 相关性(法律) 搜索引擎索引 语言模型 人机信息检索 文献检索 排名(信息检索) 答疑 向量空间模型 启发式 匹配(统计) 人工智能 法学 政治学 统计 数学
作者
Wayne Xin Zhao,Jing Liu,Ruiyang Ren,Ji-Rong Wen
标识
DOI:10.1145/3637870
摘要

Text retrieval is a long-standing research topic on information seeking, where a system is required to return relevant information resources to user’s queries in natural language. From heuristic-based retrieval methods to learning-based ranking functions, the underlying retrieval models have been continually evolved with the ever-lasting technical innovation. To design effective retrieval models, a key point lies in how to learn text representations and model the relevance matching. The recent success of pretrained language models (PLM) sheds light on developing more capable text-retrieval approaches by leveraging the excellent modeling capacity of PLMs. With powerful PLMs, we can effectively learn the semantic representations of queries and texts in the latent representation space, and further construct the semantic matching function between the dense vectors for relevance modeling. Such a retrieval approach is called dense retrieval , since it employs dense vectors to represent the texts. Considering the rapid progress on dense retrieval, this survey systematically reviews the recent progress on PLM-based dense retrieval. Different from previous surveys on dense retrieval, we take a new perspective to organize the related studies by four major aspects, including architecture, training, indexing and integration, and thoroughly summarize the mainstream techniques for each aspect. We extensively collect the recent advances on this topic, and include 300+ reference papers. To support our survey, we create a website for providing useful resources, and release a code repository for dense retrieval. This survey aims to provide a comprehensive, practical reference focused on the major progress for dense text retrieval.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
车访枫完成签到,获得积分10
刚刚
这位同学不知道叫什么好完成签到,获得积分10
4秒前
过时的煎饼关注了科研通微信公众号
8秒前
12秒前
16秒前
桐桐应助狂野的南松采纳,获得10
20秒前
24秒前
风笛完成签到 ,获得积分10
26秒前
28秒前
29秒前
34秒前
852应助ago采纳,获得10
34秒前
51秒前
56秒前
由道罡完成签到 ,获得积分10
57秒前
1分钟前
今天也学习了吗完成签到,获得积分10
1分钟前
jewel9完成签到,获得积分10
1分钟前
有魅力棉花糖完成签到,获得积分10
1分钟前
JamesPei应助江郁清采纳,获得10
1分钟前
orixero应助belly采纳,获得10
1分钟前
1分钟前
Nico发布了新的文献求助10
2分钟前
2分钟前
Priscilla完成签到,获得积分10
2分钟前
belly发布了新的文献求助10
2分钟前
Priscilla发布了新的文献求助10
2分钟前
charih完成签到 ,获得积分10
2分钟前
风趣的晓亦完成签到,获得积分20
2分钟前
111完成签到 ,获得积分10
2分钟前
传奇3应助科研通管家采纳,获得30
2分钟前
完美世界应助科研通管家采纳,获得10
2分钟前
2分钟前
2分钟前
呆萌冰烟发布了新的文献求助10
2分钟前
2分钟前
movoandy发布了新的文献求助10
3分钟前
呆萌冰烟完成签到,获得积分10
3分钟前
joysa完成签到,获得积分10
3分钟前
movoandy完成签到,获得积分10
3分钟前
高分求助中
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
Signals, Systems, and Signal Processing 610
GMP in Practice: Regulatory Expectations for the Pharmaceutical Industry 500
领导干部角色心理研究 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6283967
求助须知:如何正确求助?哪些是违规求助? 8102652
关于积分的说明 16942474
捐赠科研通 5350438
什么是DOI,文献DOI怎么找? 2843768
邀请新用户注册赠送积分活动 1820864
关于科研通互助平台的介绍 1677695