Optimal couple-group tracking control for the heterogeneous multi-agent systems with cooperative-competitive interactions via reinforcement learning method

强化学习 计算机科学 群(周期表) 跟踪(教育) 多智能体系统 控制(管理) 钢筋 人工智能 分布式计算 心理学 社会心理学 化学 教育学 有机化学
作者
Jun Li,Lianghao Ji,Cuijuan Zhang,Huaqing Li
出处
期刊:Information Sciences [Elsevier BV]
卷期号:610: 401-424 被引量:9
标识
DOI:10.1016/j.ins.2022.07.181
摘要

In this paper, we study a class of optimal couple-group tracking control (OCGTC) problems for heterogeneous multi-agent systems (HeMASs) based on reinforcement learning (RL) method, whose goal is to minimize the local tracking errors (states) and control inputs (actions) of followers by learning the dynamic knowledge of a single leader. The weakly connected multi-agent network is randomly divided into coupled sub-networks, and each agent in the same sub-network cooperates to accomplish tracking control such that the positions and velocities of all the agents converge to the same value, while the agents from different subgroups compete with each other to dissimilar tracking goals. In particular, in the discussed HeMASs, we consider agents with unknown dynamics of first-order and second-order. To solve the algebraic Riccati equation (ARE), an policy-value-based actor-critic technique is applied. Using the Lyapunov-like theorem, we verify that the local tracking error and the estimated weights of actor-critic neural networks are deduced to be uniformly ultimately bounded. Eventually, several simulations demonstrate the correctness of the retrieved theoretical results.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
曾经的朝雪完成签到 ,获得积分10
刚刚
科研通AI6.4应助Shuofan采纳,获得10
刚刚
天天快乐应助Shuofan采纳,获得10
1秒前
聪慧的曼bo完成签到,获得积分10
1秒前
科研通AI6.3应助Shuofan采纳,获得10
1秒前
科研通AI6.4应助Shuofan采纳,获得10
1秒前
英俊的铭应助Shuofan采纳,获得10
1秒前
科研通AI6.4应助Shuofan采纳,获得10
1秒前
科研通AI6.2应助Shuofan采纳,获得10
1秒前
科研通AI6.4应助Shuofan采纳,获得10
1秒前
科研通AI6.4应助Shuofan采纳,获得10
1秒前
香蕉觅云应助Shuofan采纳,获得10
1秒前
伞和尚完成签到,获得积分20
2秒前
陆菱柒完成签到,获得积分10
2秒前
LT发布了新的文献求助10
3秒前
3秒前
andy完成签到,获得积分10
4秒前
向着梦想出发完成签到,获得积分20
5秒前
5秒前
bsswk完成签到 ,获得积分10
7秒前
8秒前
9秒前
欣xin发布了新的文献求助10
11秒前
11秒前
11111111111发布了新的文献求助10
12秒前
香蕉觅云应助莫里亚蒂采纳,获得10
12秒前
谜语发布了新的文献求助10
13秒前
张文静发布了新的文献求助10
15秒前
小马甲应助合适磬采纳,获得10
16秒前
小蘑菇应助LT采纳,获得10
16秒前
完美世界应助linman采纳,获得30
17秒前
ding应助专注的秋珊采纳,获得10
18秒前
11111111111完成签到,获得积分10
18秒前
Jaketheironman完成签到,获得积分10
19秒前
20秒前
20秒前
21秒前
josh完成签到,获得积分10
22秒前
mortal发布了新的文献求助10
24秒前
莫里亚蒂发布了新的文献求助10
25秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
Cronologia da história de Macau 5000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Matrix Methods in Data Mining and Pattern Recognition 510
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7156482
求助须知:如何正确求助?哪些是违规求助? 8800955
关于积分的说明 18599329
捐赠科研通 6757512
什么是DOI,文献DOI怎么找? 3161512
关于科研通互助平台的介绍 2296290
邀请新用户注册赠送积分活动 2136249