Learning deep structured semantic models for web search using clickthrough data

计算机科学 情报检索 概率潜在语义分析 排名(信息检索) 语义搜索 人工智能 任务(项目管理) 语义计算 语义匹配 相关性(法律) 语义网 自然语言处理 匹配(统计) 统计 数学 管理 政治学 法学 经济
作者
Po-Sen Huang,Xiaodong He,Jianfeng Gao,Li Deng,Alex Acero,Larry Heck
出处
期刊:Conference on Information and Knowledge Management 卷期号:: 2333-2338 被引量:1889
标识
DOI:10.1145/2505515.2505665
摘要

Latent semantic models, such as LSA, intend to map a query to its relevant documents at the semantic level where keyword-based matching often fails. In this study we strive to develop a series of new latent semantic models with a deep structure that project queries and documents into a common low-dimensional space where the relevance of a document given a query is readily computed as the distance between them. The proposed deep structured semantic models are discriminatively trained by maximizing the conditional likelihood of the clicked documents given a query using the clickthrough data. To make our models applicable to large-scale Web search applications, we also use a technique called word hashing, which is shown to effectively scale up our semantic models to handle large vocabularies which are common in such tasks. The new models are evaluated on a Web document ranking task using a real-world data set. Results show that our best model significantly outperforms other latent semantic models, which were considered state-of-the-art in the performance prior to the work presented in this paper.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
badada发布了新的文献求助10
1秒前
Hangyu完成签到,获得积分10
1秒前
2秒前
活力的妙之完成签到,获得积分10
2秒前
SYLH应助喜悦斑马采纳,获得20
4秒前
4秒前
5秒前
呆头鹅发布了新的文献求助10
5秒前
luo完成签到,获得积分10
7秒前
9秒前
李紫硕完成签到,获得积分10
9秒前
9秒前
10秒前
元万天完成签到,获得积分10
10秒前
超级无敌万能小金毛完成签到,获得积分10
13秒前
13秒前
科目三应助谢诚杰采纳,获得10
14秒前
年三月完成签到 ,获得积分10
16秒前
jiayile发布了新的文献求助10
17秒前
18秒前
20秒前
康大帅完成签到,获得积分10
20秒前
20秒前
ahead应助Hangyu采纳,获得10
21秒前
22秒前
22秒前
玖玖完成签到,获得积分10
23秒前
koko发布了新的文献求助10
24秒前
康大帅发布了新的文献求助10
24秒前
醒醒发布了新的文献求助10
25秒前
25秒前
26秒前
kk发布了新的文献求助10
26秒前
优秀小笼包完成签到,获得积分10
27秒前
Aurora完成签到,获得积分10
27秒前
Kelly1426完成签到,获得积分10
27秒前
28秒前
29秒前
29秒前
谢诚杰发布了新的文献求助10
29秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 1000
CRC Handbook of Chemistry and Physics 104th edition 1000
Izeltabart tapatansine - AdisInsight 600
Maneuvering of a Damaged Navy Combatant 500
An International System for Human Cytogenomic Nomenclature (2024) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3769687
求助须知:如何正确求助?哪些是违规求助? 3314764
关于积分的说明 10173625
捐赠科研通 3030095
什么是DOI,文献DOI怎么找? 1662612
邀请新用户注册赠送积分活动 795054
科研通“疑难数据库(出版商)”最低求助积分说明 756519