Model-free optimal containment control of multi-agent systems based on actor-critic framework

遏制(计算机编程) 计算机科学 贝尔曼方程 趋同(经济学) 数学优化 最优控制 启发式 动态规划 功能(生物学) 控制(管理) 强化学习 纳什均衡 动作(物理) 人工神经网络 数学 人工智能 算法 量子力学 进化生物学 生物 物理 经济增长 经济 程序设计语言
作者
W. Wang,Xin Chen
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:314: 242-250 被引量:26
标识
DOI:10.1016/j.neucom.2018.06.011
摘要

This paper deals with the model-free optimal containment control problem for a class of linear multi-agent systems (MASs). In the existing results concerning containment control of MASs, the dynamics of the MASs is required to be completely known. Differently, in this paper, we propose a new distributed self-learning control scheme based on action dependent heuristic dynamic programming (ADHDP) to achieve containment control, where the model of MASs is no longer needed. The containment control problem is first transformed into a regulation problem on the dynamics of the designed local containment error. The policy iteration method based on the designed state-action value function (also called the Q-function) is introduced to deal with such a regulation problem. The convergence analysis of this policy iteration method is also given. Neural network (NN) based actor-critic framework is adopted to approximate the optimal Q-functions and the optimal control policies for facilitating the implementation of the proposed method. It shows that the approximated control policies achieve the containment control and satisfy the global Nash equilibrium. Finally, the simulation results are provided to demonstrate the effectiveness of the developed approach.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
稻草完成签到,获得积分10
刚刚
超帅诗槐发布了新的文献求助10
刚刚
vic303发布了新的文献求助10
刚刚
viycole完成签到,获得积分10
刚刚
刚刚
鹿友绿完成签到,获得积分10
1秒前
1秒前
等待的花生完成签到,获得积分10
1秒前
Huibo完成签到,获得积分10
2秒前
2秒前
leehoo完成签到,获得积分10
2秒前
3秒前
3秒前
科研GO应助mingyue采纳,获得10
3秒前
4秒前
4秒前
圆圆完成签到,获得积分10
4秒前
CHEN完成签到 ,获得积分10
5秒前
彭于晏应助顺心的巨人采纳,获得10
5秒前
Cedric完成签到,获得积分10
5秒前
传统的锦程完成签到,获得积分10
5秒前
5秒前
哼哼唧唧发布了新的文献求助10
5秒前
Huibo发布了新的文献求助10
6秒前
6秒前
啦啦啦啦完成签到,获得积分10
7秒前
独特霸完成签到,获得积分10
7秒前
喜悦的板凳完成签到 ,获得积分10
7秒前
Esther发布了新的文献求助10
7秒前
8秒前
SYLH应助木头人采纳,获得10
8秒前
银子吃好的完成签到,获得积分10
9秒前
春江发布了新的文献求助10
9秒前
核桃完成签到,获得积分0
9秒前
10秒前
orangel完成签到,获得积分10
10秒前
呆萌的u完成签到,获得积分10
10秒前
zeannezg发布了新的文献求助10
10秒前
仇湘发布了新的文献求助10
10秒前
研友_LJeoa8完成签到,获得积分10
10秒前
高分求助中
【提示信息,请勿应助】关于scihub 10000
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
Social Research Methods (4th Edition) by Maggie Walter (2019) 2390
A new approach to the extrapolation of accelerated life test data 1000
北师大毕业论文 基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 390
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
Robot-supported joining of reinforcement textiles with one-sided sewing heads 360
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4009871
求助须知:如何正确求助?哪些是违规求助? 3549812
关于积分的说明 11303839
捐赠科研通 3284342
什么是DOI,文献DOI怎么找? 1810591
邀请新用户注册赠送积分活动 886393
科研通“疑难数据库(出版商)”最低求助积分说明 811406