清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Code as Policies: Language Model Programs for Embodied Control

计算机科学 程序设计语言 Python(编程语言) 背景(考古学) 编码(集合论) 机器人 人工智能 自然语言 古生物学 集合(抽象数据类型) 生物
作者
Jacky Liang,Wenlong Huang,Fei Xia,Peng Xu,Karol Hausman,Brian Ichter,Pete Florence,Andy Zeng
标识
DOI:10.1109/icra48891.2023.10160591
摘要

Large language models (LLMs) trained on code-completion have been shown to be capable of synthesizing simple Python programs from docstrings [1]. We find that these code-writing LLMs can be re-purposed to write robot policy code, given natural language commands. Specifically, policy code can express functions or feedback loops that process perception outputs (e.g., from object detectors [2], [3]) and parameterize control primitive APIs. When provided as input several example language commands (formatted as comments) followed by corresponding policy code (via few-shot prompting), LLMs can take in new commands and autonomously re-compose API calls to generate new policy code respectively. By chaining classic logic structures and referencing third-party libraries (e.g., NumPy, Shapely) to perform arithmetic, LLMs used in this way can write robot policies that (i) exhibit spatial-geometric reasoning, (ii) generalize to new instructions, and (iii) prescribe precise values (e.g., velocities) to ambiguous descriptions (‘faster’) depending on context (i.e., behavioral commonsense). This paper presents Code as Policies: a robot-centric formulation of language model generated programs (LMPs) that can represent reactive policies (e.g., impedance controllers), as well as waypoint-based policies (vision-based pick and place, trajectory-based control), demonstrated across multiple real robot platforms. Central to our approach is prompting hierarchical code-gen (recursively defining undefined functions), which can write more complex code and also improves state-of-the-art to solve 39.8% of problems on the HumanEval [1] benchmark. Code and videos are available at https://code-as-policies.github.io
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
辛夷完成签到,获得积分10
4秒前
21秒前
斯文败类应助yana采纳,获得10
31秒前
自由从筠完成签到 ,获得积分10
34秒前
糊涂的青烟完成签到 ,获得积分10
34秒前
无语的冰淇淋完成签到 ,获得积分10
40秒前
江三村完成签到 ,获得积分10
44秒前
huanghe完成签到,获得积分10
54秒前
嗯嗯嗯哦哦哦完成签到 ,获得积分10
54秒前
1分钟前
润润轩轩完成签到 ,获得积分10
1分钟前
慕青应助volvoamg采纳,获得10
2分钟前
Skywings完成签到,获得积分10
2分钟前
LeoBigman完成签到 ,获得积分10
2分钟前
斯文败类应助volvoamg采纳,获得10
2分钟前
Akim应助volvoamg采纳,获得10
2分钟前
3分钟前
HR112完成签到 ,获得积分10
3分钟前
旅程完成签到 ,获得积分10
3分钟前
www完成签到 ,获得积分10
3分钟前
lingling完成签到 ,获得积分10
3分钟前
bzdjsmw完成签到 ,获得积分10
4分钟前
研友_n2JMKn完成签到 ,获得积分10
4分钟前
王磊完成签到 ,获得积分10
4分钟前
习月阳完成签到,获得积分10
4分钟前
lzxbarry完成签到,获得积分0
5分钟前
6分钟前
随机子发布了新的文献求助10
6分钟前
6分钟前
稻子完成签到 ,获得积分10
6分钟前
yana发布了新的文献求助10
6分钟前
yana完成签到,获得积分10
6分钟前
6分钟前
冯柳旭发布了新的文献求助10
6分钟前
ww完成签到,获得积分10
7分钟前
冯柳旭完成签到,获得积分10
7分钟前
7分钟前
wumumu发布了新的文献求助10
7分钟前
wumumu完成签到,获得积分10
7分钟前
7分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Musculoskeletal Pain - Market Insight, Epidemiology And Market Forecast - 2034 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Density Functional Theory: A Practical Introduction, 2nd Edition 840
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3749970
求助须知:如何正确求助?哪些是违规求助? 3293224
关于积分的说明 10080128
捐赠科研通 3008612
什么是DOI,文献DOI怎么找? 1652302
邀请新用户注册赠送积分活动 787340
科研通“疑难数据库(出版商)”最低求助积分说明 752096