Skill-based curiosity for intrinsically motivated reinforcement learning

好奇心 强化学习 一般化 计算机科学 任务(项目管理) 多样性(控制论) 人工智能 钢筋 代表(政治) 功能(生物学) 机器学习 心理学 工程类 数学 社会心理学 数学分析 系统工程 进化生物学 政治 法学 政治学 生物
作者
Nicolas Bougie,Ryutaro Ichise
出处
期刊:Machine Learning [Springer Nature]
卷期号:109 (3): 493-512 被引量:22
标识
DOI:10.1007/s10994-019-05845-8
摘要

Abstract Reinforcement learning methods rely on rewards provided by the environment that are extrinsic to the agent. However, many real-world scenarios involve sparse or delayed rewards. In such cases, the agent can develop its own intrinsic reward function called curiosity to enable the agent to explore its environment in the quest of new skills. We propose a novel end-to-end curiosity mechanism for deep reinforcement learning methods, that allows an agent to gradually acquire new skills. Our method scales to high-dimensional problems, avoids the need of directly predicting the future, and, can perform in sequential decision scenarios. We formulate the curiosity as the ability of the agent to predict its own knowledge about the task. We base the prediction on the idea of skill learning to incentivize the discovery of new skills, and guide exploration towards promising solutions. To further improve data efficiency and generalization of the agent, we propose to learn a latent representation of the skills. We present a variety of sparse reward tasks in MiniGrid, MuJoCo, and Atari games. We compare the performance of an augmented agent that uses our curiosity reward to state-of-the-art learners. Experimental evaluation exhibits higher performance compared to reinforcement learning models that only learn by maximizing extrinsic rewards.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
彭于晏应助高xl采纳,获得10
刚刚
嘟嘟雯完成签到 ,获得积分10
1秒前
PGD完成签到,获得积分10
1秒前
热情的纸飞机完成签到,获得积分10
2秒前
77发布了新的文献求助30
2秒前
3秒前
悦耳半梦发布了新的文献求助10
3秒前
4秒前
小马甲应助额2采纳,获得10
4秒前
追寻半仙发布了新的文献求助80
5秒前
11111发布了新的文献求助10
5秒前
ray发布了新的文献求助10
6秒前
真实的哲瀚完成签到,获得积分20
6秒前
大个应助隐形的糖豆采纳,获得10
6秒前
6秒前
完美世界应助陶醉的远山采纳,获得10
6秒前
7秒前
充电宝应助郭鹏采纳,获得10
7秒前
轩海完成签到 ,获得积分10
9秒前
violet完成签到,获得积分20
9秒前
sun发布了新的文献求助10
11秒前
ray完成签到,获得积分20
11秒前
阔达的无剑应助kw采纳,获得20
12秒前
阳洋发布了新的文献求助10
12秒前
高xl发布了新的文献求助10
13秒前
14秒前
lala完成签到,获得积分10
14秒前
JamesPei应助123好采纳,获得10
14秒前
15秒前
juan发布了新的文献求助10
16秒前
bing完成签到,获得积分10
17秒前
额2发布了新的文献求助10
17秒前
17秒前
研友_VZG7GZ应助YY采纳,获得10
17秒前
花羽发布了新的文献求助10
18秒前
fzz完成签到,获得积分10
21秒前
LTT关注了科研通微信公众号
21秒前
科研通AI2S应助violet采纳,获得10
22秒前
无限的含羞草完成签到,获得积分10
22秒前
高分求助中
Evolution 10000
ISSN 2159-8274 EISSN 2159-8290 1000
Becoming: An Introduction to Jung's Concept of Individuation 600
Ore genesis in the Zambian Copperbelt with particular reference to the northern sector of the Chambishi basin 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3161611
求助须知:如何正确求助?哪些是违规求助? 2812907
关于积分的说明 7897655
捐赠科研通 2471797
什么是DOI,文献DOI怎么找? 1316160
科研通“疑难数据库(出版商)”最低求助积分说明 631222
版权声明 602112