Relieving Popularity Bias in Interactive Recommendation: A Diversity-Novelty-Aware Reinforcement Learning Approach

计算机科学 人气 新颖性 强化学习 推荐系统 个性化 机器学习 人工智能 偏爱 多元化(营销策略) 质量(理念) 万维网 心理学 社会心理学 哲学 业务 神学 认识论 营销 经济 微观经济学
作者
Xiaoyu Shi,Quanliang Liu,Hong Xie,Di Wu,Bo Peng,Mingsheng Shang,Defu Lian
出处
期刊:ACM Transactions on Information Systems 卷期号:42 (2): 1-30 被引量:8
标识
DOI:10.1145/3618107
摘要

While personalization increases the utility of item recommendation, it also suffers from the issue of popularity bias. However, previous methods emphasize adopting supervised learning models to relieve popularity bias in the static recommendation, ignoring the dynamic transfer of user preference and amplification effects of the feedback loop in the recommender system (RS). In this paper, we focus on studying this issue in the interactive recommendation. We argue that diversification and novelty are both equally crucial for improving user satisfaction of IRS in the aforementioned setting. To achieve this goal, we propose a D iversity- N ovelty- a ware I nteractive R ecommendation framework (DNaIR) that augments offline reinforcement learning (RL) to increase the exposure rate of long-tail items with high quality. Its main idea is first to aggregate the item similarity, popularity, and quality into the reward model to help the planning of RL policy. It then designs a diversity-aware stochastic action generator to achieve an efficient and lightweight DNaIR algorithm. Extensive experiments are conducted on the three real-world datasets and an authentic RL environment (Virtual-Taobao). The experiments show that our model can better and full use of the long-tail items to improve recommendation satisfaction, especially those low popularity items with high-quality ones, thus achieving state-of-the-art performance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
空白掉落完成签到 ,获得积分10
4秒前
我艾吃饭发布了新的文献求助10
4秒前
mo发布了新的文献求助10
4秒前
5秒前
WYY发布了新的文献求助10
9秒前
星辰大海应助泡沫采纳,获得10
10秒前
12秒前
不吃辣活不了完成签到 ,获得积分10
16秒前
好运旺旺发布了新的文献求助10
16秒前
彭于晏应助左右不为难采纳,获得30
17秒前
17秒前
英姑应助Vancy采纳,获得10
20秒前
20秒前
21秒前
猫小乐C完成签到,获得积分10
22秒前
泡沫发布了新的文献求助10
22秒前
25秒前
ylt发布了新的文献求助10
26秒前
987654发布了新的文献求助10
28秒前
30秒前
30秒前
Liuzihao完成签到,获得积分10
31秒前
31秒前
从容未来发布了新的文献求助10
33秒前
宓广缘发布了新的文献求助10
33秒前
34秒前
Ava应助yuefeng采纳,获得10
34秒前
36秒前
botanist完成签到 ,获得积分10
36秒前
37秒前
SciGPT应助盖饭不加辣采纳,获得30
37秒前
称心蓉发布了新的文献求助10
37秒前
38秒前
CodeCraft应助李清湛采纳,获得10
38秒前
科研通AI2S应助科研通管家采纳,获得10
39秒前
欣喜荧完成签到,获得积分10
39秒前
无花果应助科研通管家采纳,获得10
39秒前
酷波er应助科研通管家采纳,获得10
39秒前
CodeCraft应助科研通管家采纳,获得10
39秒前
充电宝应助科研通管家采纳,获得10
40秒前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1500
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
Standard Specification for Polyolefin Chopped Strands for Use in Concrete 600
有EBL数据库的大佬进 Matrix Mathematics 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 纳米技术 物理 计算机科学 化学工程 基因 复合材料 遗传学 物理化学 免疫学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3416917
求助须知:如何正确求助?哪些是违规求助? 3018733
关于积分的说明 8884958
捐赠科研通 2705950
什么是DOI,文献DOI怎么找? 1483992
科研通“疑难数据库(出版商)”最低求助积分说明 685870
邀请新用户注册赠送积分活动 681074