已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

VIMA: General Robot Manipulation with Multimodal Prompts

计算机科学 人工智能 任务(项目管理) 机器人 一般化 变压器 人机交互 可扩展性 协议(科学) 机器学习 数学 量子力学 替代医学 管理 电压 经济 病理 数学分析 物理 数据库 医学
作者
Yunfan Jiang,Agrim Gupta,Zichen Zhang,Guanzhi Wang,Yongqiang Dou,Yanjun Chen,Li Fei-Fei,Anima Anandkumar,Yuke Zhu,Linxi Fan
出处
期刊:Cornell University - arXiv 被引量:48
标识
DOI:10.48550/arxiv.2210.03094
摘要

Prompt-based learning has emerged as a successful paradigm in natural language processing, where a single general-purpose language model can be instructed to perform any task specified by input prompts. Yet task specification in robotics comes in various forms, such as imitating one-shot demonstrations, following language instructions, and reaching visual goals. They are often considered different tasks and tackled by specialized models. We show that a wide spectrum of robot manipulation tasks can be expressed with multimodal prompts, interleaving textual and visual tokens. Accordingly, we develop a new simulation benchmark that consists of thousands of procedurally-generated tabletop tasks with multimodal prompts, 600K+ expert trajectories for imitation learning, and a four-level evaluation protocol for systematic generalization. We design a transformer-based robot agent, VIMA, that processes these prompts and outputs motor actions autoregressively. VIMA features a recipe that achieves strong model scalability and data efficiency. It outperforms alternative designs in the hardest zero-shot generalization setting by up to $2.9\times$ task success rate given the same training data. With $10\times$ less training data, VIMA still performs $2.7\times$ better than the best competing variant. Code and video demos are available at https://vimalabs.github.io/

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
谦让的思枫完成签到,获得积分10
1秒前
Yichen Zhang完成签到,获得积分10
2秒前
我不是BOB完成签到,获得积分10
3秒前
7秒前
poab发布了新的文献求助10
11秒前
11秒前
哔噗哔噗完成签到 ,获得积分10
13秒前
MchemG应助科研通管家采纳,获得10
15秒前
Hello应助科研通管家采纳,获得10
15秒前
wax应助科研通管家采纳,获得10
15秒前
科研通AI2S应助科研通管家采纳,获得10
15秒前
小蘑菇应助科研通管家采纳,获得10
15秒前
英姑应助科研通管家采纳,获得10
15秒前
nuliguan完成签到 ,获得积分10
15秒前
高高菠萝完成签到 ,获得积分10
17秒前
Tina完成签到 ,获得积分10
18秒前
Tina发布了新的文献求助10
21秒前
Lily完成签到 ,获得积分10
24秒前
25秒前
tuanzi完成签到 ,获得积分10
26秒前
威武灵阳完成签到,获得积分10
41秒前
小乌龟完成签到,获得积分10
42秒前
康KKKate完成签到 ,获得积分0
42秒前
猫吃鱼完成签到,获得积分10
43秒前
52秒前
烟花应助赛猪采纳,获得10
54秒前
Nature完成签到,获得积分10
55秒前
神外第一刀完成签到 ,获得积分10
56秒前
57秒前
zht完成签到,获得积分10
58秒前
59秒前
zwd完成签到 ,获得积分10
1分钟前
1分钟前
思源应助m30采纳,获得10
1分钟前
1分钟前
1分钟前
momo完成签到,获得积分10
1分钟前
和谐的夏岚完成签到 ,获得积分10
1分钟前
1分钟前
yaoyaoyao完成签到 ,获得积分10
1分钟前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1000
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
Plate Tectonics 500
Igneous rocks and processes: a practical guide(第二版) 500
Mantodea of the World: Species Catalog 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3407751
求助须知:如何正确求助?哪些是违规求助? 3012217
关于积分的说明 8853127
捐赠科研通 2699360
什么是DOI,文献DOI怎么找? 1479980
科研通“疑难数据库(出版商)”最低求助积分说明 684124
邀请新用户注册赠送积分活动 678380