亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Task-Oriented Deep Reinforcement Learning for Robotic Skill Acquisition and Control

强化学习 计算机科学 任务(项目管理) 人工智能 利用 机器人 基线(sea) 采样(信号处理) 机器学习 控制(管理) 模仿 德雷福斯技能获得模型 人工神经网络 工程类 计算机视觉 社会心理学 滤波器(信号处理) 海洋学 地质学 经济增长 计算机安全 经济 系统工程 心理学
作者
Guofei Xiang,Jianbo Su
出处
期刊:IEEE transactions on cybernetics [Institute of Electrical and Electronics Engineers]
卷期号:51 (2): 1056-1069 被引量:33
标识
DOI:10.1109/tcyb.2019.2949596
摘要

Reinforcement learning (RL) and imitation learning (IL), especially equipped with deep neural networks, have been widely studied for autonomous robotic skill acquisition and control tasks. However, these methods and their extensions require extensive environmental interactions during training, which greatly prevents them from being applied to real-world robots. To alleviate this problem, we present an efficient model-free off-policy actor-critic algorithm for robotic skill acquisition and continuous control, by fusing the task reward with a task-oriented guiding reward, which is formulated by leveraging few and imperfect expert demonstrations. In this framework, the agent can explore the environment more intentionally, thus sampling efficiency can be achieved; moreover, the agent can also exploit the experience more effectively, thereby substantially improved performance can be realized simultaneously. The empirical results on robotic locomotion tasks show that the proposed scheme can lower sample complexity by 2-10 times in contrast with the state-of-the-art baseline deep RL (DRL) algorithms, while achieving performance better than that of the expert. Furthermore, the proposed algorithm achieves significant improvement in both sampling efficiency and asymptotic performance on tasks with sparse and delayed reward, wherein those baseline DRL algorithms struggle to make progress. This takes a substantial step forward to implement these methods to acquire skills autonomously for real robots.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小刀发布了新的文献求助30
2秒前
八戒完成签到 ,获得积分10
9秒前
小王完成签到 ,获得积分10
14秒前
36秒前
38秒前
43秒前
小刀发布了新的文献求助10
56秒前
56秒前
小刀完成签到,获得积分10
1分钟前
Jasper应助文献求助采纳,获得10
1分钟前
2分钟前
haan完成签到,获得积分10
2分钟前
haan发布了新的文献求助10
2分钟前
乐乐应助haan采纳,获得10
2分钟前
陈尹蓝完成签到 ,获得积分10
2分钟前
康康完成签到 ,获得积分10
2分钟前
Cristina2024完成签到,获得积分10
2分钟前
2分钟前
文献求助发布了新的文献求助10
2分钟前
qqq完成签到,获得积分10
3分钟前
害羞迎南发布了新的文献求助200
5分钟前
6分钟前
6分钟前
害羞迎南完成签到,获得积分0
6分钟前
dolphin完成签到 ,获得积分10
7分钟前
NexusExplorer应助叔叔的哥哥采纳,获得10
7分钟前
lanxinyue应助科研通管家采纳,获得100
7分钟前
迷你的靖雁完成签到,获得积分10
7分钟前
8分钟前
8分钟前
wyx完成签到,获得积分10
8分钟前
yxm完成签到 ,获得积分10
8分钟前
8分钟前
8分钟前
gc完成签到 ,获得积分10
8分钟前
魏白晴完成签到,获得积分10
9分钟前
李爱国应助科研通管家采纳,获得10
9分钟前
所所应助顺利的绿真采纳,获得10
10分钟前
hongxuezhi完成签到,获得积分10
10分钟前
碧蓝问玉完成签到 ,获得积分10
11分钟前
高分求助中
Biology and Ecology of Atlantic Cod 1500
LNG地下式貯槽指針(JGA指-107-19)(Recommended practice for LNG inground storage) 1000
Second Language Writing (2nd Edition) by Ken Hyland, 2019 1000
Generalized Linear Mixed Models 第二版 1000
rhetoric, logic and argumentation: a guide to student writers 1000
QMS18Ed2 | process management. 2nd ed 1000
Operative Techniques in Pediatric Orthopaedic Surgery 510
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2922119
求助须知:如何正确求助?哪些是违规求助? 2565567
关于积分的说明 6937202
捐赠科研通 2222174
什么是DOI,文献DOI怎么找? 1181371
版权声明 588852
科研通“疑难数据库(出版商)”最低求助积分说明 577971