亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Concept2Robot: Learning manipulation concepts from instructions and human demonstrations

计算机科学 任务(项目管理) 人工智能 机器人 动觉学习 遥操作 强化学习 人机交互 一般化 机器学习 心理学 工程类 数学 数学分析 发展心理学 系统工程
作者
Lin Shao,Toki Migimatsu,Qiang Zhang,Karen Yang,Jeannette Bohg
出处
期刊:The International Journal of Robotics Research [SAGE]
卷期号:40 (12-14): 1419-1434 被引量:26
标识
DOI:10.1177/02783649211046285
摘要

We aim to endow a robot with the ability to learn manipulation concepts that link natural language instructions to motor skills. Our goal is to learn a single multi-task policy that takes as input a natural language instruction and an image of the initial scene and outputs a robot motion trajectory to achieve the specified task. This policy has to generalize over different instructions and environments. Our insight is that we can approach this problem through learning from demonstration by leveraging large-scale video datasets of humans performing manipulation actions. Thereby, we avoid more time-consuming processes such as teleoperation or kinesthetic teaching. We also avoid having to manually design task-specific rewards. We propose a two-stage learning process where we first learn single-task policies through reinforcement learning. The reward is provided by scoring how well the robot visually appears to perform the task. This score is given by a video-based action classifier trained on a large-scale human activity dataset. In the second stage, we train a multi-task policy through imitation learning to imitate all the single-task policies. In extensive simulation experiments, we show that the multi-task policy learns to perform a large percentage of the 78 different manipulation tasks on which it was trained. The tasks are of greater variety and complexity than previously considered robot manipulation tasks. We show that the policy generalizes over variations of the environment. We also show examples of successful generalization over novel but similar instructions.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
复杂的鸿煊完成签到,获得积分10
1秒前
豆包发布了新的文献求助10
3秒前
mmyhn发布了新的文献求助10
10秒前
Cakoibao完成签到,获得积分10
13秒前
23秒前
25秒前
黑大帅发布了新的文献求助10
26秒前
wanci应助黑大帅采纳,获得10
32秒前
38秒前
星落枝头发布了新的文献求助10
45秒前
49秒前
qq完成签到 ,获得积分10
52秒前
Alex发布了新的文献求助10
55秒前
孤星独韵发布了新的文献求助10
56秒前
彬彬有礼完成签到 ,获得积分10
57秒前
1分钟前
1分钟前
iveuplife发布了新的文献求助10
1分钟前
1分钟前
小蘑菇应助怡然平露采纳,获得10
1分钟前
爱科研的小凡完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
泥嚎芽发布了新的文献求助10
1分钟前
1分钟前
1分钟前
1分钟前
清爽的罡应助科研通管家采纳,获得10
1分钟前
深情安青应助科研通管家采纳,获得10
1分钟前
怡然平露发布了新的文献求助10
1分钟前
1分钟前
Akim应助Amekaji采纳,获得10
1分钟前
曹兆发布了新的文献求助100
1分钟前
1分钟前
ajing完成签到,获得积分10
1分钟前
YYL完成签到 ,获得积分10
1分钟前
呵呵哒发布了新的文献求助30
1分钟前
Ava应助iveuplife采纳,获得10
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Principles of town planning : translating concepts to applications 500
Wearable Exoskeleton Systems, 2nd Edition 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6058263
求助须知:如何正确求助?哪些是违规求助? 7890954
关于积分的说明 16296664
捐赠科研通 5203251
什么是DOI,文献DOI怎么找? 2783828
邀请新用户注册赠送积分活动 1766484
关于科研通互助平台的介绍 1647087