亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Optimal Synchronization Control of Heterogeneous Asymmetric Input-Constrained Unknown Nonlinear MASs via Reinforcement Learning

汉密尔顿-雅各比-贝尔曼方程 强化学习 正确性 计算机科学 趋同(经济学) 数学优化 同步(交流) 非线性系统 观察员(物理) 状态空间 国家(计算机科学) 控制理论(社会学) 最优控制 数学 控制(管理) 人工智能 算法 计算机网络 频道(广播) 统计 物理 量子力学 经济 经济增长
作者
Lina Xia,Qing Li,Ruizhuo Song,Hamidreza Modares
出处
期刊:IEEE/CAA Journal of Automatica Sinica [Institute of Electrical and Electronics Engineers]
卷期号:9 (3): 520-532 被引量:58
标识
DOI:10.1109/jas.2021.1004359
摘要

The asymmetric input-constrained optimal synchronization problem of heterogeneous unknown nonlinear multiagent systems (MASs) is considered in the paper. Intuitively, a state-space transformation is performed such that satisfaction of symmetric input constraints for the transformed system guarantees satisfaction of asymmetric input constraints for the original system. Then, considering that the leader's information is not available to every follower, a novel distributed observer is designed to estimate the leader's state using only exchange of information among neighboring followers. After that, a network of augmented systems is constructed by combining observers and followers dynamics. A nonquadratic cost function is then leveraged for each augmented system (agent) for which its optimization satisfies input constraints and its corresponding constrained Hamilton-Jacobi-Bellman (HJB) equation is solved in a data-based fashion. More specifically, a data-based off-policy reinforcement learning (RL) algorithm is presented to learn the solution to the constrained HJB equation without requiring the complete knowledge of the agents' dynamics. Convergence of the improved RL algorithm to the solution to the constrained HJB equation is also demonstrated. Finally, the correctness and validity of the theoretical results are demonstrated by a simulation example.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
11秒前
喵呜发布了新的文献求助10
14秒前
JamesPei应助xhy采纳,获得10
15秒前
纯属小白完成签到 ,获得积分10
15秒前
16秒前
酷波er应助风中的冰淇淋采纳,获得10
27秒前
FashionBoy应助等等采纳,获得10
28秒前
欣喜无血完成签到,获得积分10
28秒前
我爱夏日长完成签到,获得积分10
28秒前
43秒前
烟花应助科研通管家采纳,获得10
47秒前
星辰大海应助科研通管家采纳,获得10
47秒前
缓慢怜菡应助科研通管家采纳,获得20
47秒前
47秒前
乐乐应助科研通管家采纳,获得10
47秒前
52秒前
lilx2019完成签到,获得积分10
1分钟前
spring完成签到 ,获得积分10
1分钟前
瘦瘦乌龟完成签到 ,获得积分10
1分钟前
yu完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
mathmotive完成签到,获得积分10
1分钟前
欣喜无血发布了新的文献求助10
1分钟前
东北二踢脚完成签到 ,获得积分10
1分钟前
杰尼乾乾完成签到 ,获得积分10
1分钟前
Lan完成签到 ,获得积分10
1分钟前
Orange应助假面绅士采纳,获得10
1分钟前
核潜艇很优秀完成签到,获得积分0
1分钟前
香蕉觅云应助STH9527采纳,获得10
1分钟前
1分钟前
niuniuniu发布了新的文献求助10
1分钟前
1分钟前
1分钟前
BA1完成签到,获得积分10
1分钟前
STH9527发布了新的文献求助10
1分钟前
小橙完成签到 ,获得积分10
1分钟前
等等发布了新的文献求助10
1分钟前
大力的灵雁应助LEGEND采纳,获得10
1分钟前
大力的灵雁应助LEGEND采纳,获得10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Salmon nasal cartilage-derived proteoglycan complexes influence the gut microbiota and bacterial metabolites in mice 2000
The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
ON THE THEORY OF BIRATIONAL BLOWING-UP 666
Signals, Systems, and Signal Processing 610
LASER: A Phase 2 Trial of 177 Lu-PSMA-617 as Systemic Therapy for RCC 520
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6381008
求助须知:如何正确求助?哪些是违规求助? 8193322
关于积分的说明 17317265
捐赠科研通 5434397
什么是DOI,文献DOI怎么找? 2874604
邀请新用户注册赠送积分活动 1851385
关于科研通互助平台的介绍 1696148