Optimal model-free output synchronization of heterogeneous systems using off-policy reinforcement learning

同步(交流) 强化学习 控制理论(社会学) 计算机科学 最优控制 观察员(物理) 控制器(灌溉) 数学优化 控制(管理) 数学 人工智能 生物 量子力学 物理 频道(广播) 计算机网络 农学
作者
Hamidreza Modares,Subramanya Nageshrao,Gabriel A. D. Lopes,Robert Babuška,Frank L. Lewis
出处
期刊:Automatica [Elsevier BV]
卷期号:71: 334-341 被引量:150
标识
DOI:10.1016/j.automatica.2016.05.017
摘要

This paper considers optimal output synchronization of heterogeneous linear multi-agent systems. Standard approaches to output synchronization of heterogeneous systems require either the solution of the output regulator equations or the incorporation of a p-copy of the leader's dynamics in the controller of each agent. By contrast, in this paper neither one is needed. Moreover, here both the leader's and the follower's dynamics are assumed to be unknown. First, a distributed adaptive observer is designed to estimate the leader's state for each agent. The output synchronization problem is then formulated as an optimal control problem and a novel model-free off-policy reinforcement learning algorithm is developed to solve the optimal output synchronization problem online in real time. It is shown that this optimal distributed approach implicitly solves the output regulation equations without actually doing so. Simulation results are provided to verify the effectiveness of the proposed approach.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
152455完成签到 ,获得积分10
刚刚
Zxx应助甜兰儿采纳,获得10
2秒前
shang完成签到,获得积分10
3秒前
曲奇吐司完成签到,获得积分10
3秒前
7秒前
甜甜纸飞机完成签到 ,获得积分10
10秒前
愚者完成签到,获得积分10
10秒前
12秒前
强小强努力努力完成签到,获得积分10
17秒前
小巧的白竹完成签到,获得积分10
18秒前
怡然的剑封完成签到,获得积分20
19秒前
火烧云完成签到 ,获得积分10
19秒前
搜集达人应助王一一一一采纳,获得10
19秒前
甜甜的紫菜完成签到 ,获得积分10
21秒前
霸王龙完成签到,获得积分10
24秒前
manmanzhong完成签到 ,获得积分10
25秒前
JasonChan完成签到 ,获得积分10
26秒前
Owen应助怡然的剑封采纳,获得10
26秒前
二氧化硒完成签到,获得积分10
27秒前
Zsy完成签到,获得积分10
27秒前
甜兰儿完成签到,获得积分10
29秒前
Wss完成签到 ,获得积分10
33秒前
铑氟钌发少年狂完成签到 ,获得积分10
34秒前
pengyh8完成签到 ,获得积分10
35秒前
闪闪的灵寒完成签到,获得积分10
36秒前
Brian完成签到,获得积分10
40秒前
如意语山完成签到 ,获得积分10
40秒前
Serein完成签到,获得积分10
44秒前
晓风完成签到,获得积分10
44秒前
秋秋完成签到 ,获得积分10
45秒前
只争朝夕应助科研通管家采纳,获得10
45秒前
今后应助科研通管家采纳,获得10
45秒前
xzy998应助科研通管家采纳,获得10
45秒前
xzy998应助科研通管家采纳,获得10
46秒前
46秒前
ding应助科研通管家采纳,获得10
46秒前
46秒前
桐桐应助科研通管家采纳,获得10
46秒前
46秒前
打打应助科研通管家采纳,获得30
46秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Applied Min-Max Approach to Missile Guidance and Control 5000
Metallurgy at high pressures and high temperatures 2000
Inorganic Chemistry Eighth Edition 1200
Anionic polymerization of acenaphthylene: identification of impurity species formed as by-products 1000
The Psychological Quest for Meaning 800
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6325951
求助须知:如何正确求助?哪些是违规求助? 8142021
关于积分的说明 17071784
捐赠科研通 5378470
什么是DOI,文献DOI怎么找? 2854190
邀请新用户注册赠送积分活动 1831847
关于科研通互助平台的介绍 1683076