Reinforcement learning for versatile, dynamic, and robust bipedal locomotion control

机器人 稳健性(进化) 强化学习 计算机科学 机器人运动 机器人学 人工智能 控制工程 控制理论(社会学) 机器人控制 工程类 控制(管理) 移动机器人 生物化学 化学 基因
作者
Zhongyu Li,Xue Bin Peng,Pieter Abbeel,Sergey Levine,Glen Berseth,Koushil Sreenath
出处
期刊:The International Journal of Robotics Research [SAGE]
卷期号:44 (5): 840-888 被引量:76
标识
DOI:10.1177/02783649241285161
摘要

This paper presents a comprehensive study on using deep reinforcement learning (RL) to create dynamic locomotion controllers for bipedal robots. Going beyond focusing on a single locomotion skill, we develop a general control solution that can be used for a range of dynamic bipedal skills, from periodic walking and running to aperiodic jumping and standing. Our RL-based controller incorporates a novel dual-history architecture, utilizing both a long-term and short-term input/output (I/O) history of the robot. This control architecture, when trained through the proposed end-to-end RL approach, consistently outperforms other methods across a diverse range of skills in both simulation and the real world. The study also delves into the adaptivity and robustness introduced by the proposed RL system in developing locomotion controllers. We demonstrate that the proposed architecture can adapt to both time-invariant dynamics shifts and time-variant changes, such as contact events, by effectively using the robot’s I/O history. Additionally, we identify task randomization as another key source of robustness, fostering better task generalization and compliance to disturbances. The resulting control policies can be successfully deployed on Cassie, a torque-controlled human-sized bipedal robot. This work pushes the limits of agility for bipedal robots through extensive real-world experiments. We demonstrate a diverse range of locomotion skills, including: robust standing, versatile walking, fast running with a demonstration of a 400-meter dash, and a diverse set of jumping skills, such as standing long jumps and high jumps.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
可爱的函函应助shinn采纳,获得10
刚刚
量子星尘发布了新的文献求助10
2秒前
ding应助张志恒采纳,获得10
4秒前
上官若男应助huihui2121采纳,获得10
5秒前
6秒前
7秒前
8秒前
小蘑菇应助沙滩的收印采纳,获得10
8秒前
打打应助小米采纳,获得10
9秒前
10秒前
10秒前
彭于晏应助喵喵苗采纳,获得10
10秒前
darling发布了新的文献求助10
10秒前
谦让的牛排完成签到 ,获得积分10
12秒前
深情安青应助ZZZ采纳,获得10
12秒前
heguangjie发布了新的文献求助10
13秒前
shinn发布了新的文献求助10
13秒前
英姑应助学习采纳,获得10
14秒前
pear发布了新的文献求助10
15秒前
15秒前
xu1227发布了新的文献求助10
16秒前
Orange应助唠叨的以柳采纳,获得10
16秒前
samchen完成签到,获得积分10
17秒前
领导范儿应助迟迟采纳,获得10
17秒前
123456完成签到,获得积分10
17秒前
量子星尘发布了新的文献求助30
18秒前
苗条的嘉熙完成签到,获得积分10
18秒前
科研通AI2S应助坦率铅笔采纳,获得10
19秒前
lzn完成签到 ,获得积分10
20秒前
量子星尘发布了新的文献求助20
20秒前
ahaha发布了新的文献求助10
20秒前
21秒前
1111发布了新的文献求助10
21秒前
清风荷影完成签到 ,获得积分10
24秒前
24秒前
丘比特应助zxh采纳,获得10
25秒前
xiaoma完成签到,获得积分10
26秒前
Criminology34应助蓝色斑马采纳,获得10
27秒前
27秒前
嗯嗯发布了新的文献求助10
28秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to strong mixing conditions volume 1-3 5000
Agyptische Geschichte der 21.30. Dynastie 3000
„Semitische Wissenschaften“? 1510
从k到英国情人 1500
Cummings Otolaryngology Head and Neck Surgery 8th Edition 800
Real World Research, 5th Edition 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5761125
求助须知:如何正确求助?哪些是违规求助? 5528093
关于积分的说明 15399017
捐赠科研通 4897695
什么是DOI,文献DOI怎么找? 2634394
邀请新用户注册赠送积分活动 1582500
关于科研通互助平台的介绍 1537788