A Deep Reinforcement Learning Approach to Improve the Learning Performance in Process Control

强化学习 计算机科学 PID控制器 适应性 过程(计算) 控制器(灌溉) 人工智能 非线性系统 控制理论(社会学) 贝尔曼方程 国家(计算机科学) 时差学习 控制(管理) 机器学习 控制工程 数学优化 算法 数学 工程类 物理 操作系统 生物 量子力学 生态学 温度控制 农学
作者
Yaoyao Bao,Yuanming Zhu,Feng Qian
出处
期刊:Industrial & Engineering Chemistry Research [American Chemical Society]
卷期号:60 (15): 5504-5515 被引量:43
标识
DOI:10.1021/acs.iecr.0c05678
摘要

Advanced model-based control methods have been widely used in industrial process control, but excellent performance requires regular maintenance of its model. Reinforcement learning can online update its policy through the observed data by interacting with the environment. Since a fast and stable learning process is required to improve the adaptability of the controller, we propose an improved deep deterministic actor critic predictor in this paper, where the immediate reward is separated from the action-value function to provide the actor with reliable gradient information at early stages. Then, an expectation form of policy gradient is developed based on the assumption that the state obeys the normal distribution. Simulation results show that the proposed algorithm achieves a more stable and faster learning procedure than those state-of-art deep reinforcement learning (DRL) algorithms. Meanwhile, the obtained policy achieves a more advantageous performance than the fine-tuned proportional integral and derivative (PID) and linear model predictive controllers, especially for those processes with nonlinearity. These indicate that the improved DRL controller has the potential to become an important tool in practical applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
hhnicai发布了新的文献求助10
1秒前
2秒前
wangyr11发布了新的文献求助10
3秒前
4秒前
4秒前
乐乐应助机灵的嘉熙采纳,获得10
5秒前
5秒前
白河完成签到,获得积分10
6秒前
6秒前
Arthur完成签到,获得积分10
8秒前
8秒前
白河发布了新的文献求助30
9秒前
稻草人完成签到 ,获得积分10
13秒前
13秒前
15秒前
大模型应助猫滩儿采纳,获得10
16秒前
zwy发布了新的文献求助20
16秒前
Estrella发布了新的文献求助10
17秒前
18秒前
高大的画板完成签到,获得积分10
19秒前
上官若男应助单向度的人采纳,获得10
21秒前
22秒前
吉小聿发布了新的文献求助10
24秒前
Yikehudou发布了新的文献求助200
24秒前
萧寒发布了新的文献求助10
24秒前
Owen应助安静的早晨采纳,获得10
24秒前
猫滩儿发布了新的文献求助10
25秒前
顾矜应助小刘鸭鸭采纳,获得10
25秒前
25秒前
爆米花应助Estrella采纳,获得10
26秒前
方羽应助llll采纳,获得20
26秒前
大气夜山完成签到 ,获得积分10
26秒前
28秒前
28秒前
29秒前
29秒前
文静菠萝完成签到,获得积分20
30秒前
白问寒发布了新的文献求助10
31秒前
31秒前
ppf发布了新的文献求助10
32秒前
高分求助中
Востребованный временем 2500
Les Mantodea de Guyane 1000
Very-high-order BVD Schemes Using β-variable THINC Method 970
Field Guide to Insects of South Africa 660
Foucault's Technologies Another Way of Cutting Reality 500
Forensic Chemistry 400
Toward personalized care for insomnia in the US Army: a machine learning model to predict response to cognitive behavioral therapy for insomnia 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3392344
求助须知:如何正确求助?哪些是违规求助? 3003047
关于积分的说明 8807005
捐赠科研通 2689807
什么是DOI,文献DOI怎么找? 1473309
科研通“疑难数据库(出版商)”最低求助积分说明 681498
邀请新用户注册赠送积分活动 674316