On the Opportunities and Challenges of Offline Reinforcement Learning for Recommender Systems

强化学习 推荐系统 计算机科学 效率低下 在线和离线 领域(数学) 钢筋 人工智能 数据科学 机器学习 工程类 纯数学 经济 微观经济学 操作系统 数学 结构工程
作者
Xiaocong Chen,Siyu Wang,Julian McAuley,Dietmar Jannach,Lina Yao
出处
期刊:ACM Transactions on Information Systems 卷期号:42 (6): 1-26 被引量:1
标识
DOI:10.1145/3661996
摘要

Reinforcement learning serves as a potent tool for modeling dynamic user interests within recommender systems, garnering increasing research attention of late. However, a significant drawback persists: its poor data efficiency, stemming from its interactive nature. The training of reinforcement learning-based recommender systems demands expensive online interactions to amass adequate trajectories, essential for agents to learn user preferences. This inefficiency renders reinforcement learning-based recommender systems a formidable undertaking, necessitating the exploration of potential solutions. Recent strides in offline reinforcement learning present a new perspective. Offline reinforcement learning empowers agents to glean insights from offline datasets and deploy learned policies in online settings. Given that recommender systems possess extensive offline datasets, the framework of offline reinforcement learning aligns seamlessly. Despite being a burgeoning field, works centered on recommender systems utilizing offline reinforcement learning remain limited. This survey aims to introduce and delve into offline reinforcement learning within recommender systems, offering an inclusive review of existing literature in this domain. Furthermore, we strive to underscore prevalent challenges, opportunities, and future pathways, poised to propel research in this evolving field.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
坚定毛衣完成签到,获得积分10
1秒前
大模型应助Mole采纳,获得10
2秒前
2秒前
打打应助寒冷诗霜采纳,获得10
2秒前
搞怪的访旋完成签到,获得积分10
4秒前
兔兜完成签到,获得积分10
5秒前
稳重冰岚完成签到,获得积分10
6秒前
刘仪雪应助康凯采纳,获得10
6秒前
超级的友绿完成签到,获得积分10
7秒前
7秒前
7秒前
FYY发布了新的文献求助10
7秒前
7秒前
10秒前
10秒前
10秒前
11秒前
Spidyyy发布了新的文献求助10
12秒前
12秒前
wjx发布了新的文献求助30
13秒前
13秒前
wxy完成签到,获得积分10
14秒前
嘟噜嘟噜发布了新的文献求助10
14秒前
15秒前
15秒前
15秒前
Mole发布了新的文献求助10
16秒前
WM应助独特的凝荷采纳,获得10
16秒前
一期一会完成签到,获得积分10
16秒前
17秒前
19秒前
dmr发布了新的文献求助10
20秒前
22秒前
Yasmine发布了新的文献求助10
22秒前
23秒前
糖糖发布了新的文献求助10
24秒前
Mole完成签到,获得积分10
26秒前
充电宝应助剑舞红颜笑采纳,获得10
27秒前
潟湖迟鱼完成签到,获得积分10
27秒前
MOMO完成签到 ,获得积分10
28秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2000
Very-high-order BVD Schemes Using β-variable THINC Method 1200
进口的时尚——14世纪东方丝绸与意大利艺术 Imported Fashion:Oriental Silks and Italian Arts in the 14th Century 800
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 550
Green building development for a sustainable environment with artificial intelligence technology 500
Zeitschrift für Orient-Archäologie 500
The Collected Works of Jeremy Bentham: Rights, Representation, and Reform: Nonsense upon Stilts and Other Writings on the French Revolution 320
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3351347
求助须知:如何正确求助?哪些是违规求助? 2976817
关于积分的说明 8676705
捐赠科研通 2657976
什么是DOI,文献DOI怎么找? 1455336
科研通“疑难数据库(出版商)”最低求助积分说明 673836
邀请新用户注册赠送积分活动 664315