已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Operational Safe Control for Reinforcement-Learning-Based Robot Autonomy

强化学习 机器人 计算机科学 控制(管理) 人工智能 软件部署 自治 软件工程 政治学 法学
作者
Xu Zhou
标识
DOI:10.23919/ccc52363.2021.9549723
摘要

Reinforcement learning (RL) has been widely used for robot autonomy because it can adapt to dynamic or unknown environments by automatically learning optimal control policies from the interactions between robots and environments. However, the practical deployment of RL can endanger the safety of both robots and environments because many RL methods must experience failures during the training phase. These failures can be reduced or avoided by assuming knowing prior knowledge about the states and environments in the training phase, but this assumption is easily invalid in practical applications, especially with unknown environments. In addition, restarting a training episode could be difficult in practice because the robot may be stuck in the failures. To solve these problems, we propose an operational safe control framework that can automatically recover from failures and reduce failure risks without any prior knowledge. Our framework consists of three steps: (1) detect failures and revert to safe actions, (2) collect correction samples to learn a potential that provides internal environment information to robots, (3) use the potential to shape a safe reward that biases safe explorations. A maze navigation example is used to demonstrate that our method outperforms the traditional reinforcement learning with significantly less failures.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
dzh发布了新的文献求助10
刚刚
大华完成签到,获得积分10
1秒前
榴莲姑娘完成签到 ,获得积分10
2秒前
执梳完成签到,获得积分10
2秒前
NexusExplorer应助饱满的映天采纳,获得10
2秒前
明钟达完成签到,获得积分10
7秒前
传奇3应助科研通管家采纳,获得10
8秒前
qwwhu应助科研通管家采纳,获得10
8秒前
8秒前
华仔应助科研通管家采纳,获得10
8秒前
Lucas应助科研通管家采纳,获得10
8秒前
Angenstern完成签到 ,获得积分10
10秒前
16秒前
17秒前
Maryamgvl完成签到 ,获得积分10
18秒前
Criminology34应助qyn1234566采纳,获得80
20秒前
科研通AI6应助liaofang采纳,获得10
21秒前
21秒前
22秒前
AM发布了新的文献求助10
22秒前
23秒前
23秒前
zbol发布了新的文献求助10
23秒前
平淡钧发布了新的文献求助10
26秒前
孙东玥发布了新的文献求助10
26秒前
27秒前
小蘑菇应助maomao201026采纳,获得10
27秒前
兴奋雁蓉完成签到,获得积分10
28秒前
淮安石河子完成签到 ,获得积分10
29秒前
艳阳天完成签到 ,获得积分10
31秒前
鬼笔环肽完成签到 ,获得积分10
31秒前
34秒前
SciGPT应助无私的梦凡采纳,获得10
34秒前
也有发布了新的文献求助10
40秒前
zbol完成签到,获得积分10
40秒前
42秒前
h0jian09完成签到,获得积分10
43秒前
yncjdxyjs发布了新的文献求助10
47秒前
superfatcat完成签到,获得积分10
47秒前
dzh完成签到,获得积分20
48秒前
高分求助中
Pipeline and riser loss of containment 2001 - 2020 (PARLOC 2020) 1000
Comparing natural with chemical additive production 500
Machine Learning in Chemistry 500
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 500
A Manual for the Identification of Plant Seeds and Fruits : Second revised edition 500
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.) 400
Refractory Castable Engineering 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5197833
求助须知:如何正确求助?哪些是违规求助? 4379025
关于积分的说明 13637476
捐赠科研通 4234845
什么是DOI,文献DOI怎么找? 2323025
邀请新用户注册赠送积分活动 1321090
关于科研通互助平台的介绍 1271903