亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Delay-aware model-based reinforcement learning for continuous control

强化学习 计算机科学 马尔可夫决策过程 过程(计算) 人工智能 增强学习 控制(管理) 马尔可夫过程 国家(计算机科学) 马尔可夫链 动作(物理) 机器学习 算法 数学 物理 操作系统 统计 量子力学
作者
Baiming Chen,Mengdi Xu,Liang Li,Ding Zhao
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:450: 119-128 被引量:45
标识
DOI:10.1016/j.neucom.2021.04.015
摘要

Action delays degrade the performance of reinforcement learning in many real-world systems. This paper proposes a formal definition of delay-aware Markov Decision Process and proves it can be transformed into standard MDP with augmented states using the Markov reward process. We develop a delay-aware model-based reinforcement learning framework that can incorporate the multi-step delay into the learned system models without learning effort. Experiments with the Gym and MuJoCo platforms show that the proposed delay-aware model-based algorithm is more efficient in training and transferable between systems with various durations of delay compared with state-of-the-art model-free reinforcement learning methods.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
王_123123123123w完成签到 ,获得积分10
3秒前
英俊的铭应助小太阳采纳,获得10
5秒前
8秒前
Guo完成签到,获得积分10
9秒前
善学以致用应助2:38am采纳,获得10
11秒前
科研通AI5应助不能随便采纳,获得10
15秒前
一路微笑完成签到,获得积分10
20秒前
十一完成签到 ,获得积分10
22秒前
zhongshumen完成签到 ,获得积分20
26秒前
27秒前
一个完成签到 ,获得积分10
27秒前
小菡菡发布了新的文献求助10
31秒前
32秒前
断鸿完成签到 ,获得积分10
33秒前
37秒前
38秒前
2:38am完成签到,获得积分10
40秒前
Orange应助wmr采纳,获得80
41秒前
单薄的败发布了新的文献求助10
44秒前
2:38am发布了新的文献求助10
44秒前
望其项背发布了新的文献求助10
44秒前
月月完成签到 ,获得积分10
45秒前
47秒前
月月关注了科研通微信公众号
49秒前
50秒前
夕立完成签到,获得积分10
51秒前
不能随便发布了新的文献求助10
53秒前
55秒前
1分钟前
1分钟前
tg113d发布了新的文献求助10
1分钟前
konosuba完成签到,获得积分10
1分钟前
龙卡烧烤店完成签到,获得积分10
1分钟前
小二郎应助李鬼胥采纳,获得10
1分钟前
1分钟前
失眠的之桃完成签到 ,获得积分10
1分钟前
qiu完成签到,获得积分10
1分钟前
阳光溪流完成签到 ,获得积分10
1分钟前
Hello应助单纯的雅香采纳,获得10
1分钟前
木林森林木完成签到 ,获得积分10
1分钟前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
いちばんやさしい生化学 500
Genre and Graduate-Level Research Writing 500
The First Nuclear Era: The Life and Times of a Technological Fixer 500
Unusual formation of 4-diazo-3-nitriminopyrazoles upon acid nitration of pyrazolo[3,4-d][1,2,3]triazoles 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3674245
求助须知:如何正确求助?哪些是违规求助? 3229667
关于积分的说明 9786628
捐赠科研通 2940217
什么是DOI,文献DOI怎么找? 1611741
邀请新用户注册赠送积分活动 761012
科研通“疑难数据库(出版商)”最低求助积分说明 736372