Optimal Synchronization Control of Heterogeneous Asymmetric Input-Constrained Unknown Nonlinear MASs via Reinforcement Learning

汉密尔顿-雅各比-贝尔曼方程 强化学习 正确性 计算机科学 趋同(经济学) 数学优化 同步(交流) 非线性系统 观察员(物理) 状态空间 国家(计算机科学) 控制理论(社会学) 最优控制 数学 控制(管理) 人工智能 算法 计算机网络 频道(广播) 统计 物理 量子力学 经济 经济增长
作者
Lina Xia,Qing Li,Ruizhuo Song,Hamidreza Modares
出处
期刊:IEEE/CAA Journal of Automatica Sinica [Institute of Electrical and Electronics Engineers]
卷期号:9 (3): 520-532 被引量:41
标识
DOI:10.1109/jas.2021.1004359
摘要

The asymmetric input-constrained optimal synchronization problem of heterogeneous unknown nonlinear multiagent systems (MASs) is considered in the paper. Intuitively, a state-space transformation is performed such that satisfaction of symmetric input constraints for the transformed system guarantees satisfaction of asymmetric input constraints for the original system. Then, considering that the leader's information is not available to every follower, a novel distributed observer is designed to estimate the leader's state using only exchange of information among neighboring followers. After that, a network of augmented systems is constructed by combining observers and followers dynamics. A nonquadratic cost function is then leveraged for each augmented system (agent) for which its optimization satisfies input constraints and its corresponding constrained Hamilton-Jacobi-Bellman (HJB) equation is solved in a data-based fashion. More specifically, a data-based off-policy reinforcement learning (RL) algorithm is presented to learn the solution to the constrained HJB equation without requiring the complete knowledge of the agents' dynamics. Convergence of the improved RL algorithm to the solution to the constrained HJB equation is also demonstrated. Finally, the correctness and validity of the theoretical results are demonstrated by a simulation example.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ZLY发布了新的文献求助10
刚刚
英姑应助书羽采纳,获得10
1秒前
1秒前
11完成签到,获得积分20
1秒前
Jasper应助孤独雪柳采纳,获得10
2秒前
淡然雪枫发布了新的文献求助10
2秒前
腼腆的立辉完成签到,获得积分10
2秒前
柒柒发布了新的文献求助10
2秒前
5秒前
5秒前
6秒前
outbed完成签到,获得积分10
7秒前
情怀应助我又可以了采纳,获得10
7秒前
8秒前
9秒前
YYONE发布了新的文献求助10
9秒前
木雅发布了新的文献求助30
9秒前
9秒前
Elsia完成签到 ,获得积分10
9秒前
wuaaaaa_L发布了新的文献求助10
10秒前
12秒前
斯文的寒凡完成签到,获得积分10
13秒前
书羽发布了新的文献求助10
13秒前
14秒前
able1325完成签到 ,获得积分10
15秒前
15秒前
插秧露娜发布了新的文献求助10
15秒前
15秒前
田様应助聪明的背包采纳,获得10
16秒前
爱卿5271发布了新的文献求助10
16秒前
Lucas应助Xiaoxiao采纳,获得10
16秒前
asdfzxcv应助库库里里大采纳,获得10
16秒前
大个应助xiaohuipan采纳,获得10
16秒前
荔枝发布了新的文献求助10
16秒前
18秒前
嘻嘻发布了新的文献求助20
19秒前
20秒前
天狼完成签到,获得积分10
20秒前
打打应助PPSlu采纳,获得10
20秒前
追风发布了新的文献求助10
20秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
《The Emergency Nursing High-Yield Guide》 (或简称为 Emergency Nursing High-Yield Essentials) 500
The Dance of Butch/Femme: The Complementarity and Autonomy of Lesbian Gender Identity 500
Differentiation Between Social Groups: Studies in the Social Psychology of Intergroup Relations 350
Investigating the correlations between point load strength index, uniaxial compressive strength and Brazilian tensile strength of sandstones. A case study of QwaQwa sandstone deposit 300
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5885298
求助须知:如何正确求助?哪些是违规求助? 6616496
关于积分的说明 15702041
捐赠科研通 5005830
什么是DOI,文献DOI怎么找? 2696713
邀请新用户注册赠送积分活动 1640457
关于科研通互助平台的介绍 1595022