清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Few-shot reasoning-based safe reinforcement learning framework for autonomous robot navigation

强化学习 更安全的 计算机科学 机器人 动作选择 集合(抽象数据类型) 软件部署 人工智能 动作(物理) 自主机器人 一次性 机器学习 工程类 移动机器人 计算机安全 软件工程 物理 神经科学 生物 程序设计语言 机械工程 量子力学 感知
作者
Weiqiang Wang,Xu Zhou,Benlian Xu,Siwen Chen,Mingli Lu,Jun Li,Yuejiang Gu
出处
期刊:International Journal of Automation and Control [Inderscience Publishers]
卷期号:18 (1): 30-52
标识
DOI:10.1504/ijaac.2024.135093
摘要

Unsafe explorations in the training phase hinder the practical deployment of reinforcement learning (RL) on autonomous robots. Some safe RL methods use safety constraints from prior or external knowledge to reduce or avoid unsafe explorations, but such knowledge is usually unavailable in practice, especially in unknown environments. In this work, we propose a few-shot reasoning-based safe reinforcement learning framework that includes a new few-shot learning method with dynamic support set to reason the safety of unexplored actions and hence guide safer action selection. Additionally, it endows robots with the capability of reverting to previous safe states and reflecting on failures to update the dynamic support set and further improve the accuracy of safety reasoning. Experimental results show that our new few-shot learning method is more accurate, and our proposed framework can significantly reduce the number of failures in the learning phase, especially for long-term autonomy.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
任性的思远完成签到 ,获得积分10
10秒前
一个爱打乒乓球的彪完成签到 ,获得积分10
13秒前
古炮完成签到 ,获得积分10
17秒前
榴莲姑娘完成签到,获得积分10
19秒前
星星完成签到 ,获得积分10
22秒前
zhuosht完成签到 ,获得积分10
26秒前
SUNNYONE完成签到 ,获得积分10
26秒前
萱棚完成签到 ,获得积分10
27秒前
情怀应助虾米3采纳,获得10
29秒前
navon完成签到,获得积分10
34秒前
李博士完成签到 ,获得积分10
37秒前
qiongqiong完成签到 ,获得积分10
38秒前
温暖的蚂蚁完成签到 ,获得积分10
48秒前
东明完成签到 ,获得积分10
50秒前
dawn完成签到 ,获得积分10
53秒前
林好人完成签到 ,获得积分10
1分钟前
Lucycomplex完成签到,获得积分10
1分钟前
李一来完成签到,获得积分20
1分钟前
墨z完成签到 ,获得积分10
1分钟前
was_3完成签到,获得积分0
1分钟前
vungocbinh完成签到,获得积分10
1分钟前
qiancib202完成签到,获得积分0
1分钟前
芬芬完成签到 ,获得积分10
1分钟前
研友_GZ3zRn完成签到 ,获得积分0
1分钟前
健壮的凝冬完成签到 ,获得积分10
1分钟前
冷艳的又蓝完成签到 ,获得积分10
1分钟前
小鱼女侠完成签到 ,获得积分10
2分钟前
Nowind完成签到,获得积分10
2分钟前
lgy完成签到 ,获得积分10
2分钟前
2分钟前
搬砖的化学男完成签到 ,获得积分0
2分钟前
深海鱼类完成签到 ,获得积分10
2分钟前
枯藤老柳树完成签到,获得积分10
2分钟前
我是笨蛋完成签到 ,获得积分10
2分钟前
Xzx1995完成签到 ,获得积分10
2分钟前
研友_5Zl4VZ完成签到,获得积分10
2分钟前
笨笨青筠完成签到 ,获得积分10
3分钟前
Song完成签到 ,获得积分10
3分钟前
虾米3关注了科研通微信公众号
3分钟前
乌特拉完成签到 ,获得积分10
3分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6436686
求助须知:如何正确求助?哪些是违规求助? 8251037
关于积分的说明 17551422
捐赠科研通 5494996
什么是DOI,文献DOI怎么找? 2898214
邀请新用户注册赠送积分活动 1874900
关于科研通互助平台的介绍 1716186