Receding Horizon Actor–Critic Learning Control for Nonlinear Time-Delay Systems With Unknown Dynamics

控制理论(社会学) 模型预测控制 非线性系统 控制器(灌溉) 趋同(经济学) 最优控制 机电一体化 计算机科学 区间(图论) 动态规划 地平线 理论(学习稳定性) 控制系统 控制(管理) 控制工程 数学优化 数学 工程类 人工智能 算法 经济 电气工程 物理 机器学习 几何学 组合数学 生物 量子力学 经济增长 农学
作者
Jiahang Liu,Xinglong Zhang,Xin Xu,Quan Xiong
出处
期刊:IEEE transactions on systems, man, and cybernetics [Institute of Electrical and Electronics Engineers]
卷期号:53 (8): 4980-4993 被引量:6
标识
DOI:10.1109/tsmc.2023.3254911
摘要

With the development of modern mechatronics and networked systems, the controller design of time-delay systems has received notable attention. Time delays can greatly influence the stability and performance of the systems, especially for optimal control design. In this article, we propose a receding horizon actor–critic learning control approach for near-optimal control of nonlinear time-delay systems (RACL-TD) with unknown dynamics. In the proposed approach, a data-driven predictor for nonlinear time-delay systems is first learned based on the Koopman theory using precollected samples. Then, a receding horizon actor–critic architecture is designed to learn a near-optimal control policy. In RACL-TD, the terminal cost is determined by using the Lyapunov–Krasovskii approach so that the influences of the delayed states and control inputs can be well addressed. Furthermore, a relaxed terminal condition is present to reduce the computational cost. The convergence and optimality of RACL-TD in each prediction interval as well as the closed-loop property of the system are discussed and analyzed. Simulation results on a two-stage time-delayed chemical reactor illustrate that RACL-TD can achieve better control performance than nonlinear model predictive control (MPC) and infinite-horizon adaptive dynamic programming. Moreover, RACL-TD can have less computational cost than nonlinear MPC.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
调皮的土豆完成签到,获得积分10
刚刚
yiyiluo发布了新的文献求助10
刚刚
张行关注了科研通微信公众号
刚刚
FashionBoy应助小妤丸子采纳,获得10
1秒前
高兴的海豚完成签到,获得积分10
1秒前
倪晨发布了新的文献求助10
1秒前
机灵紫萍发布了新的文献求助10
1秒前
1秒前
线条完成签到 ,获得积分10
2秒前
SciGPT应助欢呼妙菱采纳,获得10
2秒前
2秒前
yeah完成签到,获得积分10
3秒前
3秒前
3秒前
3秒前
斯文败类应助芝麻球ii采纳,获得10
4秒前
surain发布了新的文献求助10
4秒前
4秒前
呵呵呵呵应助自然1111采纳,获得10
5秒前
5秒前
何以解忧完成签到,获得积分10
5秒前
LSxtd完成签到,获得积分20
6秒前
结实三颜完成签到,获得积分10
6秒前
乔乔发布了新的文献求助10
6秒前
领导范儿应助帕尼灬尼采纳,获得10
6秒前
瞌睡社畜发布了新的文献求助10
6秒前
7秒前
SYLH应助虎子采纳,获得10
8秒前
爆米花应助yuanhao采纳,获得10
9秒前
9秒前
斯文幻儿发布了新的文献求助10
9秒前
10秒前
终澈完成签到,获得积分10
10秒前
Junping发布了新的文献求助10
10秒前
橘生淮南发布了新的文献求助10
11秒前
11秒前
12秒前
清宁亦无拘完成签到 ,获得积分10
12秒前
张行发布了新的文献求助10
12秒前
852应助踏雪无痕采纳,获得10
13秒前
高分求助中
A new approach to the extrapolation of accelerated life test data 1000
Handbook of Marine Craft Hydrodynamics and Motion Control, 2nd Edition 500
‘Unruly’ Children: Historical Fieldnotes and Learning Morality in a Taiwan Village (New Departures in Anthropology) 400
Indomethacinのヒトにおける経皮吸収 400
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 350
Robot-supported joining of reinforcement textiles with one-sided sewing heads 320
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3987021
求助须知:如何正确求助?哪些是违规求助? 3529365
关于积分的说明 11244629
捐赠科研通 3267729
什么是DOI,文献DOI怎么找? 1803932
邀请新用户注册赠送积分活动 881223
科研通“疑难数据库(出版商)”最低求助积分说明 808635