Optimal tracking control based on reinforcement learning value iteration algorithm for time-delayed nonlinear systems with external disturbances and input constraints

汉密尔顿-雅各比-贝尔曼方程 控制理论(社会学) 非线性系统 强化学习 计算机科学 有界函数 贝尔曼方程 人工神经网络 观察员(物理) 弹道 最优控制 跟踪误差 控制器(灌溉) 迭代学习控制 跟踪(教育) 功能(生物学) 数学优化 数学 控制(管理) 人工智能 生物 数学分析 物理 天文 进化生物学 量子力学 教育学 心理学 农学
作者
Mehdi Mohammadi,Mohammad Mehdi Arefi,Peyman Setoodeh,Okyay Kaynak
出处
期刊:Information Sciences [Elsevier BV]
卷期号:554: 84-98 被引量:32
标识
DOI:10.1016/j.ins.2020.11.057
摘要

This article investigates the design of an optimal tracking controller for a class of nonlinear continuous-time systems with time-delay, mismatched external disturbances and input constraints. The technique of integral reinforcement learning (IRL) is utilized for determining the control input that optimizes an objective function. To enable the usage of an estimation of the external disturbances in the recursive objective function, a disturbance observer is designed. For the derivation of the optimal control input, a Hamilton-Jacobi-Bellman (HJB) equation is employed and solved using the iterative IRL algorithm. The proposed approach guarantees that in the presence of mismatched disturbances, the output of the time-delayed nonlinear system tracks the desired trajectory with bounded error. A critic neural network is designed for the implementation of the proposed approach. The efficiency of the method is illustrated by a simulation example.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Jiang-Yujia发布了新的文献求助10
1秒前
爆米花应助乐观板凳采纳,获得10
1秒前
jasur发布了新的文献求助10
2秒前
98发布了新的文献求助10
3秒前
4秒前
7秒前
yoyo完成签到 ,获得积分10
7秒前
7秒前
科目三应助王燚欣采纳,获得10
7秒前
出生完成签到,获得积分10
8秒前
梦香馨完成签到,获得积分10
8秒前
botion完成签到,获得积分20
8秒前
8秒前
98完成签到,获得积分10
8秒前
10秒前
笨笨善若发布了新的文献求助10
10秒前
Owen应助阿布采纳,获得10
11秒前
12秒前
sparkle发布了新的文献求助10
13秒前
Micheal完成签到,获得积分10
13秒前
JamesPei应助海绵宝宝采纳,获得10
13秒前
13秒前
科研通AI5应助yangwei采纳,获得10
13秒前
科研通AI5应助鱼鱼采纳,获得10
13秒前
林快点完成签到,获得积分10
14秒前
cadcae发布了新的文献求助30
15秒前
ZXB发布了新的文献求助30
16秒前
共享精神应助要减肥期待采纳,获得30
16秒前
18秒前
拼搏太英完成签到,获得积分10
19秒前
19秒前
Ming Chen发布了新的文献求助10
19秒前
20秒前
CAE上路到上吊完成签到,获得积分10
20秒前
lerrygg完成签到,获得积分10
20秒前
20秒前
谭鸿强完成签到,获得积分20
21秒前
隐形曼青应助精明怜南采纳,获得10
21秒前
guitarist完成签到 ,获得积分10
21秒前
22秒前
高分求助中
Continuum Thermodynamics and Material Modelling 2000
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
いちばんやさしい生化学 500
The First Nuclear Era: The Life and Times of a Technological Fixer 500
岡本唐貴自伝的回想画集 500
Atmosphere-ice-ocean interactions in the Antarctic 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3679877
求助须知:如何正确求助?哪些是违规求助? 3232478
关于积分的说明 9803409
捐赠科研通 2943775
什么是DOI,文献DOI怎么找? 1614240
邀请新用户注册赠送积分活动 762115
科研通“疑难数据库(出版商)”最低求助积分说明 737223