已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Deep Reinforcement Learning: A Survey

强化学习 人工智能 计算机科学 模仿 机器学习 心理学 社会心理学
作者
Xu Wang,Sen Wang,Xingxing Liang,Dawei Zhao,Jincai Huang,Xin Xu,Bin Dai,Qiguang Miao
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:: 1-15 被引量:249
标识
DOI:10.1109/tnnls.2022.3207346
摘要

Deep reinforcement learning (DRL) integrates the feature representation ability of deep learning with the decision-making ability of reinforcement learning so that it can achieve powerful end-to-end learning control capabilities. In the past decade, DRL has made substantial advances in many tasks that require perceiving high-dimensional input and making optimal or near-optimal decisions. However, there are still many challenging problems in the theory and applications of DRL, especially in learning control tasks with limited samples, sparse rewards, and multiple agents. Researchers have proposed various solutions and new theories to solve these problems and promote the development of DRL. In addition, deep learning has stimulated the further development of many subfields of reinforcement learning, such as hierarchical reinforcement learning (HRL), multiagent reinforcement learning, and imitation learning. This article gives a comprehensive overview of the fundamental theories, key algorithms, and primary research domains of DRL. In addition to value-based and policy-based DRL algorithms, the advances in maximum entropy-based DRL are summarized. The future research topics of DRL are also analyzed and discussed.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
亦之发布了新的文献求助10
1秒前
深情的友易完成签到,获得积分10
1秒前
依恋发布了新的文献求助10
1秒前
Garfield完成签到 ,获得积分10
2秒前
春山完成签到 ,获得积分10
5秒前
大气的身影完成签到,获得积分10
5秒前
Ss完成签到 ,获得积分10
5秒前
Haki完成签到,获得积分10
5秒前
思源应助依恋采纳,获得10
5秒前
7秒前
Auxin完成签到,获得积分10
7秒前
AdventureChen完成签到 ,获得积分10
8秒前
9秒前
9秒前
飞快的雁完成签到 ,获得积分10
10秒前
gy完成签到,获得积分10
11秒前
绿茶不茶完成签到 ,获得积分10
11秒前
依恋完成签到,获得积分10
12秒前
12秒前
小小付完成签到,获得积分10
12秒前
simon完成签到 ,获得积分10
12秒前
明明发布了新的文献求助10
12秒前
李健应助重要的鱼采纳,获得10
13秒前
dkx完成签到 ,获得积分10
13秒前
桉豆完成签到 ,获得积分10
14秒前
gy发布了新的文献求助10
14秒前
15秒前
15秒前
小蝶完成签到 ,获得积分10
15秒前
iuuuu完成签到 ,获得积分10
16秒前
贪玩丸子完成签到 ,获得积分10
16秒前
Ancoes发布了新的文献求助10
17秒前
遇上就这样吧完成签到,获得积分0
17秒前
柔弱熊猫完成签到 ,获得积分10
17秒前
lucy完成签到,获得积分10
18秒前
Criminology34完成签到,获得积分0
18秒前
lucy发布了新的文献求助10
21秒前
JamesPei应助KlayPatrick采纳,获得10
22秒前
澄子完成签到 ,获得积分0
22秒前
23秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Reproduction Third Edition 3000
Comprehensive Methanol Science Production, Applications, and Emerging Technologies 2000
化妆品原料学 1000
1st Edition Sports Rehabilitation and Training Multidisciplinary Perspectives By Richard Moss, Adam Gledhill 600
小学科学课程与教学 500
Study and Interlaboratory Validation of Simultaneous LC-MS/MS Method for Food Allergens Using Model Processed Foods 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5644285
求助须知:如何正确求助?哪些是违规求助? 4763340
关于积分的说明 15024405
捐赠科研通 4802493
什么是DOI,文献DOI怎么找? 2567479
邀请新用户注册赠送积分活动 1525242
关于科研通互助平台的介绍 1484674