Policy Search for Model Predictive Control With Application to Agile Drone Flight

模型预测控制 杠杆(统计) 计算机科学 敏捷软件开发 人工智能 无人机 启发式 控制器(灌溉) 机器学习 参数化复杂度 机器人学 控制工程 机器人 控制(管理) 工程类 算法 软件工程 操作系统 生物 遗传学 农学
作者
Yunlong Song,Davide Scaramuzza
出处
期刊:IEEE Transactions on Robotics [Institute of Electrical and Electronics Engineers]
卷期号:38 (4): 2114-2130 被引量:34
标识
DOI:10.1109/tro.2022.3141602
摘要

Policy search and model predictive control (MPC) are two different paradigms for robot control: policy search has the strength of automatically learning complex policies using experienced data, and MPC can offer optimal control performance using models and trajectory optimization. An open research question is how to leverage and combine the advantages of both approaches. In this article, we provide an answer by using policy search for automatically choosing high-level decision variables for MPC, which leads to a novel policy-search-for-model-predictive-control framework . Specifically, we formulate the MPC as a parameterized controller, where the hard-to-optimize decision variables are represented as high-level policies. Such a formulation allows optimizing policies in a self-supervised fashion. We validate this framework by focusing on a challenging problem in agile drone flight: flying a quadrotor through fast-moving gates. Experiments show that our controller achieves robust and real-time control performance in both simulation and the real world. The proposed framework offers a new perspective for merging learning and control.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
CipherSage应助嘻嘻采纳,获得10
1秒前
3秒前
4秒前
4秒前
cbc发布了新的文献求助10
6秒前
FashionBoy应助wu采纳,获得10
7秒前
Carl发布了新的文献求助10
8秒前
9秒前
9秒前
大模型应助帆蚌侠采纳,获得10
10秒前
10秒前
无极微光应助贪玩含卉采纳,获得20
12秒前
风中文昊完成签到,获得积分10
13秒前
木木啊发布了新的文献求助30
14秒前
zhixiang完成签到,获得积分10
14秒前
乐乐发布了新的文献求助10
14秒前
14秒前
BulingBuling完成签到,获得积分10
15秒前
开朗活泼的大山完成签到,获得积分10
15秒前
15秒前
16秒前
Allen完成签到,获得积分10
16秒前
猕猴桃完成签到,获得积分10
17秒前
wxx发布了新的文献求助10
17秒前
两小完成签到,获得积分10
17秒前
17秒前
beichuanheqi发布了新的文献求助10
19秒前
19秒前
Hello应助Carl采纳,获得10
19秒前
7777777发布了新的文献求助10
19秒前
20秒前
wanci应助科研通管家采纳,获得10
20秒前
wanci应助科研通管家采纳,获得10
20秒前
张欢馨应助科研通管家采纳,获得30
20秒前
20秒前
wanci应助科研通管家采纳,获得10
20秒前
wanci应助科研通管家采纳,获得10
20秒前
爆米花应助科研通管家采纳,获得10
20秒前
贪玩含卉完成签到,获得积分10
20秒前
20秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
Research Methods for Applied Linguistics 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6406789
求助须知:如何正确求助?哪些是违规求助? 8225992
关于积分的说明 17444652
捐赠科研通 5459496
什么是DOI,文献DOI怎么找? 2884846
邀请新用户注册赠送积分活动 1861286
关于科研通互助平台的介绍 1701779