A Safe and Self-Recoverable Reinforcement Learning Framework for Autonomous Robots

强化学习 计算机科学 机器人 过程(计算) 软件部署 人工智能 趋同(经济学) 国家(计算机科学) 软件工程 算法 经济增长 操作系统 经济
作者
Weiqiang Wang,Xu Zhou,Benlian Xu,Mingli Lu,Yuxin Zhang,Yuhang Gu
标识
DOI:10.23919/ccc55666.2022.9901669
摘要

Reinforcement learning (RL) holds the promise of autonomous robots because it can adapt to dynamic or unknown environments by automatically learning optimal control policies from the interactions between robots and environments. However, the interactions can be unsafe to both robots and environments during the learning phase, which hinders the practical deployment of RL. Some safe RL methods have been proposed to improve the learning safety by using external or prior knowledge to guide safe actions, but it is difficult to assume having this knowledge in practical applications, especially in unknown environments. More importantly, considering failures are unavoidable in practice, current safe RL lacks the capability of recovering to safe states from failures so that the learning cannot be continued and finished. To solve these problems, we propose a safe and self-recoverable reinforcement learning framework that can predict and prohibit other unsafe actions based on known, explored unsafe actions during the exploration process, and can self-recover to a safe state when a failure occurs. The maze navigation simulation results show that our approach can not only significantly reduce the number of failures but also accelerate the convergence of reinforcement learning.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
怡然的梦之完成签到,获得积分10
1秒前
1秒前
cnkly完成签到,获得积分10
1秒前
鱼儿完成签到,获得积分10
3秒前
000完成签到,获得积分10
3秒前
受昂夫应助六六采纳,获得10
3秒前
momo19完成签到,获得积分10
3秒前
ylf发布了新的文献求助10
3秒前
英子完成签到 ,获得积分10
3秒前
yunwen完成签到,获得积分10
4秒前
跳跃稀发布了新的文献求助10
4秒前
GingerF应助老板娘采纳,获得50
5秒前
H_H完成签到,获得积分10
5秒前
脑洞疼应助鹤辞云归采纳,获得10
5秒前
谦让小松鼠完成签到 ,获得积分10
5秒前
ydk完成签到,获得积分10
5秒前
老八完成签到,获得积分10
6秒前
6秒前
香蕉觅云应助mimilv采纳,获得10
6秒前
愉快怀绿发布了新的文献求助10
6秒前
bobo完成签到,获得积分0
6秒前
慕青应助小李老博采纳,获得10
6秒前
天马行空完成签到,获得积分10
7秒前
甜甜晓露完成签到,获得积分10
7秒前
cchuang完成签到,获得积分10
7秒前
7秒前
在水一方应助patrick采纳,获得10
7秒前
清漪完成签到,获得积分10
8秒前
哈哈哈完成签到,获得积分10
8秒前
8秒前
包美莹完成签到 ,获得积分10
9秒前
梅雨季来信完成签到,获得积分10
9秒前
安详三问完成签到,获得积分10
9秒前
baqiuzunzhe发布了新的文献求助10
9秒前
冬夕焼完成签到,获得积分10
9秒前
lululullulu完成签到,获得积分10
9秒前
开心飞烟完成签到 ,获得积分10
10秒前
Lulu完成签到 ,获得积分10
11秒前
林夏完成签到,获得积分0
12秒前
Mayie完成签到 ,获得积分10
14秒前
高分求助中
Malcolm Fraser : a biography 680
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Organic Reactions Volume 118 400
A Foreign Missionary on the Long March: The Unpublished Memoirs of Arnolis Hayman of the China Inland Mission 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6459492
求助须知:如何正确求助?哪些是违规求助? 8268526
关于积分的说明 17622801
捐赠科研通 5528809
什么是DOI,文献DOI怎么找? 2905931
邀请新用户注册赠送积分活动 1882676
关于科研通互助平台的介绍 1727899