Multi-H∞ Controls for Unknown Input-Interference Nonlinear System With Reinforcement Learning

非线性系统 控制理论(社会学) 干扰(通信) 强化学习 计算机科学 人工神经网络 纳什均衡 趋同(经济学) 非线性规划 数学 数学优化 人工智能 控制(管理) 经济增长 量子力学 计算机网络 物理 频道(广播) 经济
作者
Yongfeng Lv,Jing Na,Xiaowei Zhao,Yingbo Huang,Xuemei Ren
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:34 (9): 5601-5613 被引量:23
标识
DOI:10.1109/tnnls.2021.3130092
摘要

This article studies the multi- [Formula: see text] controls for the input-interference nonlinear systems via adaptive dynamic programming (ADP) method, which allows for multiple inputs to have the individual selfish component of the strategy to resist weighted interference. In this line, the ADP scheme is used to learn the Nash-optimization solutions of the input-interference nonlinear system such that multiple [Formula: see text] performance indices can reach the defined Nash equilibrium. First, the input-interference nonlinear system is given and the Nash equilibrium is defined. An adaptive neural network (NN) observer is introduced to identify the input-interference nonlinear dynamics. Then, the critic NNs are used to learn the multiple [Formula: see text] performance indices. A novel adaptive law is designed to update the critic NN weights by minimizing the Hamiltonian-Jacobi-Isaacs (HJI) equation, which can be used to directly calculate the multi- [Formula: see text] controls effectively by using input-output data such that the actor structure is avoided. Moreover, the control system stability and updated parameter convergence are proved. Finally, two numerical examples are simulated to verify the proposed ADP scheme for the input-interference nonlinear system.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
hgcyp完成签到,获得积分10
2秒前
ysh完成签到,获得积分10
2秒前
2秒前
4秒前
4秒前
5秒前
wang完成签到,获得积分10
6秒前
Jzhang应助Yimim采纳,获得10
7秒前
沐风发布了新的文献求助20
8秒前
汉关发布了新的文献求助10
10秒前
10秒前
葶儿完成签到,获得积分10
10秒前
安详中蓝完成签到 ,获得积分10
11秒前
呆萌士晋发布了新的文献求助10
11秒前
11秒前
13秒前
呆头发布了新的文献求助10
15秒前
若水发布了新的文献求助200
16秒前
16秒前
17秒前
子川发布了新的文献求助10
17秒前
大头娃娃没下巴完成签到,获得积分10
19秒前
liyuchen完成签到,获得积分10
19秒前
CipherSage应助Lxxx_7采纳,获得10
20秒前
烟花应助永远少年采纳,获得10
20秒前
meng发布了新的文献求助10
22秒前
科研通AI5应助贪吃的猴子采纳,获得10
24秒前
24秒前
可爱的彩虹完成签到,获得积分10
24秒前
小确幸完成签到,获得积分10
24秒前
彭于晏应助毛毛虫采纳,获得10
25秒前
LilyChen完成签到 ,获得积分10
25秒前
Owen应助Su采纳,获得10
25秒前
25秒前
25秒前
26秒前
27秒前
yyyy关注了科研通微信公众号
27秒前
Jane完成签到 ,获得积分10
28秒前
28秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527990
求助须知:如何正确求助?哪些是违规求助? 3108173
关于积分的说明 9287913
捐赠科研通 2805882
什么是DOI,文献DOI怎么找? 1540119
邀请新用户注册赠送积分活动 716941
科研通“疑难数据库(出版商)”最低求助积分说明 709824