Time-Varying Optimal Formation Control for Second-Order Multiagent Systems Based on Neural Network Observer and Reinforcement Learning

反推 强化学习 观察员(物理) 计算机科学 控制理论(社会学) 人工神经网络 非线性系统 理论(学习稳定性) Lyapunov稳定性 国家观察员 多智能体系统 李雅普诺夫函数 协议(科学) 自适应控制 国家(计算机科学) 数学优化 控制(管理) 数学 人工智能 算法 医学 物理 替代医学 量子力学 机器学习 病理
作者
Jie Lan,Yan‐Jun Liu,Dengxiu Yu,Guoxing Wen,Shaocheng Tong,Lei Liu
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:35 (3): 3144-3155 被引量:42
标识
DOI:10.1109/tnnls.2022.3158085
摘要

This article addresses a distributed time-varying optimal formation protocol for a class of second-order uncertain nonlinear dynamic multiagent systems (MASs) based on an adaptive neural network (NN) state observer through the backstepping method and simplified reinforcement learning (RL). Each follower agent is subjected to only local information and measurable partial states due to actual sensor limitations. In view of the distributed optimized formation strategic needs, the uncertain nonlinear dynamics and undetectable states may jointly affect the stability of the time-varying cooperative formation control. Furthermore, focusing on Hamilton-Jacobi-Bellman optimization, it is almost incapable of directly dealing with unknown equations. Above uncertainty and immeasurability processed by adaptive state observer and NN simplified RL are further designed to achieve desired second-order formation configuration at the least cost. The optimization protocol can not only solve the undetectable states and realize the prescribed time-varying formation performance on the premise that all the errors are SGUUB, but also prove the stability and update the critics and actors easily. Through the above-mentioned approaches offer an optimal control scheme to address time-varying formation control. Finally, the validity of the theoretical method is proven by the Lyapunov stability theory and digital simulation.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小巧的香旋完成签到,获得积分10
刚刚
友好惜儿完成签到,获得积分10
刚刚
研友_8KAOBn完成签到,获得积分10
刚刚
星辰大海应助wonder采纳,获得10
1秒前
可乐水发布了新的文献求助10
1秒前
hugoidea完成签到,获得积分10
1秒前
1秒前
Smurf完成签到,获得积分10
1秒前
1秒前
科目三应助光亮的听南采纳,获得10
2秒前
2秒前
2秒前
Rong发布了新的文献求助10
3秒前
zehua309完成签到,获得积分10
3秒前
长命百岁完成签到 ,获得积分10
3秒前
Echo发布了新的文献求助10
3秒前
Wind发布了新的文献求助10
3秒前
4秒前
4秒前
sb发布了新的文献求助10
4秒前
彭于晏应助SDP采纳,获得10
4秒前
美少叔叔完成签到 ,获得积分10
4秒前
Bear发布了新的文献求助10
5秒前
5秒前
曾雅麟发布了新的文献求助10
5秒前
NoMigraine完成签到,获得积分10
5秒前
慕青应助njzhangyanyang采纳,获得10
6秒前
6秒前
丹青完成签到 ,获得积分10
7秒前
7秒前
7秒前
8秒前
asdasdas发布了新的文献求助10
8秒前
9秒前
9秒前
爆米花应助活泼靖荷采纳,获得10
10秒前
萤火虫发布了新的文献求助10
10秒前
10秒前
10秒前
量子星尘发布了新的文献求助10
10秒前
高分求助中
【提示信息,请勿应助】关于scihub 10000
A new approach to the extrapolation of accelerated life test data 1000
徐淮辽南地区新元古代叠层石及生物地层 500
Coking simulation aids on-stream time 450
康复物理因子治疗 400
北师大毕业论文 基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 390
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4016497
求助须知:如何正确求助?哪些是违规求助? 3556675
关于积分的说明 11322036
捐赠科研通 3289416
什么是DOI,文献DOI怎么找? 1812458
邀请新用户注册赠送积分活动 888053
科研通“疑难数据库(出版商)”最低求助积分说明 812060