Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation

计算机科学 虚拟现实 人机交互
作者
Marcel Torne,Anthony Simeonov,Zechu Li,Andie Chan,Tao Chen,Abhishek Gupta,Pulkit Agrawal
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2403.03949
摘要

Imitation learning methods need significant human supervision to learn policies robust to changes in object poses, physical disturbances, and visual distractors. Reinforcement learning, on the other hand, can explore the environment autonomously to learn robust behaviors but may require impractical amounts of unsafe real-world data collection. To learn performant, robust policies without the burden of unsafe real-world data collection or extensive human supervision, we propose RialTo, a system for robustifying real-world imitation learning policies via reinforcement learning in "digital twin" simulation environments constructed on the fly from small amounts of real-world data. To enable this real-to-sim-to-real pipeline, RialTo proposes an easy-to-use interface for quickly scanning and constructing digital twins of real-world environments. We also introduce a novel "inverse distillation" procedure for bringing real-world demonstrations into simulated environments for efficient fine-tuning, with minimal human intervention and engineering required. We evaluate RialTo across a variety of robotic manipulation problems in the real world, such as robustly stacking dishes on a rack, placing books on a shelf, and six other tasks. RialTo increases (over 67%) in policy robustness without requiring extensive human data collection. Project website and videos at https://real-to-sim-to-real.github.io/RialTo/
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
马马马发布了新的文献求助30
1秒前
白月光完成签到,获得积分10
1秒前
2秒前
Sea完成签到,获得积分10
2秒前
江三村完成签到 ,获得积分10
2秒前
没头脑和不高兴完成签到 ,获得积分10
3秒前
王梓磬完成签到,获得积分10
5秒前
奥特曼完成签到 ,获得积分10
6秒前
顾矜应助科研通管家采纳,获得10
7秒前
萧水白应助科研通管家采纳,获得30
7秒前
hehuan0520完成签到,获得积分10
7秒前
doclarrin完成签到 ,获得积分10
8秒前
jojo完成签到,获得积分10
8秒前
MoonFlows应助迪亚波罗采纳,获得30
9秒前
淋漓尽致完成签到,获得积分10
10秒前
dh完成签到,获得积分10
11秒前
爱科研的小孙孙完成签到,获得积分10
11秒前
柏林熊完成签到,获得积分10
12秒前
李哈哈完成签到 ,获得积分10
12秒前
心灵美的岂愈完成签到,获得积分10
12秒前
Xiaoyan完成签到,获得积分10
12秒前
wwww完成签到 ,获得积分10
12秒前
开心便当完成签到,获得积分10
14秒前
乐乐乐乐乐乐应助yzqtf采纳,获得10
15秒前
chen完成签到,获得积分10
17秒前
Promise完成签到 ,获得积分10
17秒前
Ganlou完成签到,获得积分20
17秒前
白日焰火完成签到 ,获得积分10
17秒前
凊嗏淡墨完成签到,获得积分10
19秒前
niuniu发布了新的文献求助10
20秒前
11完成签到,获得积分10
21秒前
lzzzz完成签到,获得积分10
22秒前
Hik关注了科研通微信公众号
23秒前
Aurora完成签到,获得积分10
25秒前
lcsolar完成签到,获得积分10
26秒前
cff完成签到 ,获得积分10
27秒前
烟花应助gyy采纳,获得10
28秒前
31秒前
cc完成签到 ,获得积分10
31秒前
yuuuue完成签到 ,获得积分10
31秒前
高分求助中
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Chen Hansheng: China’s Last Romantic Revolutionary 500
宽禁带半导体紫外光电探测器 388
Case Research: The Case Writing Process 300
Global Geological Record of Lake Basins 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3142849
求助须知:如何正确求助?哪些是违规求助? 2793786
关于积分的说明 7807358
捐赠科研通 2450052
什么是DOI,文献DOI怎么找? 1303590
科研通“疑难数据库(出版商)”最低求助积分说明 627016
版权声明 601350