Optimal tracking control of batch processes with time-invariant state delay: Adaptive Q-learning with two-dimensional state and control policy

计算机科学 国家(计算机科学) 增强学习 不变(物理) 控制(管理) 跟踪(教育) 控制理论(社会学) LTI系统理论 人工智能 强化学习 算法 数学 线性系统 数学物理 数学分析 教育学 心理学
作者
Huiyuan Shi,Mengdi Lv,Xueying Jiang,Chengli Su,Ping Li
出处
期刊:Engineering Applications of Artificial Intelligence [Elsevier BV]
卷期号:132: 108006-108006 被引量:4
标识
DOI:10.1016/j.engappai.2024.108006
摘要

Given that conventional model-based control methods have some limitations for dynamic systems with unknown model parameters and existing reinforcement learning methods do not take batch and time delay information into account, a novel data-based adaptive Q-learning approach with two-dimensional (2D) state and control policy is proposed to address the optimal tracking control issue for batch processes with time-invariant state delay. The extended delay state space equation, value function, Q function and optimal performance index are initially presented along the time and batch directions. By examining the correlation between the 2D value function and the 2D Q function, a delay-dependent 2D Bellman equation is designed independent of the process model, which is solved to obtain the expression of the control law. Without requiring prior knowledge of the system, the optimal gain matrices of the control law are further learned by using the current and historical state, output error values and time delay information of the timewise and batchwise. It is feasible to achieve accelerated convergence and reduced errors between the optimal control gain matrices and the learning gain matrices, hence enhancing the tracking capabilities of the systems. At the same time, the unbiasedness and convergence of the given adaptive Q-learning approach are strictly proved. The effectiveness of the proposed algorithm is ultimately validated by simulation comparisons of injection molding, specifically regarding the convergence of control gains and the tracking of output.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
玉鱼儿完成签到,获得积分10
1秒前
今后应助想吃排骨了采纳,获得20
1秒前
犹豫的向松完成签到 ,获得积分10
2秒前
英勇的犀牛完成签到 ,获得积分10
3秒前
青菜完成签到,获得积分10
3秒前
ntxlks完成签到,获得积分10
4秒前
安妮完成签到,获得积分10
4秒前
科研顺利完成签到,获得积分10
4秒前
嘉汐完成签到,获得积分10
5秒前
lydiaabc完成签到,获得积分10
6秒前
852应助CK采纳,获得10
8秒前
sscss完成签到,获得积分10
9秒前
感性的伟诚完成签到 ,获得积分10
9秒前
听话的咖啡完成签到,获得积分20
10秒前
齐云山完成签到,获得积分10
10秒前
番茄鸡蛋仔完成签到,获得积分10
10秒前
活力棉花糖关注了科研通微信公众号
11秒前
sym_cool完成签到,获得积分10
11秒前
峰儿背完成签到 ,获得积分10
12秒前
阿北完成签到,获得积分10
14秒前
zyy完成签到 ,获得积分10
15秒前
Flynut完成签到,获得积分10
16秒前
666完成签到,获得积分10
17秒前
WXyue完成签到 ,获得积分10
17秒前
怡然以南完成签到 ,获得积分10
18秒前
小白一枚完成签到 ,获得积分10
18秒前
水工完成签到,获得积分10
18秒前
黑豆完成签到,获得积分10
19秒前
magin完成签到 ,获得积分10
19秒前
倪妮完成签到 ,获得积分10
19秒前
20秒前
儿茶素完成签到,获得积分10
20秒前
李文广完成签到,获得积分10
20秒前
任性吐司完成签到 ,获得积分10
21秒前
马前人完成签到,获得积分10
22秒前
23秒前
slz发布了新的文献求助10
23秒前
fdpb完成签到,获得积分10
24秒前
CK发布了新的文献求助10
25秒前
卜十三发布了新的文献求助10
26秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cronologia da história de Macau 5000
咳嗽・喀痰の診療ガイドライン第2版2025 800
Petrology and Plate Tectonics 800
Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600
Electrode Potentials 550
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7006499
求助须知:如何正确求助?哪些是违规求助? 8681017
关于积分的说明 18400491
捐赠科研通 6489004
什么是DOI,文献DOI怎么找? 3103282
关于科研通互助平台的介绍 2171040
邀请新用户注册赠送积分活动 2079418