Adaptive MPC path-tracking controller based on reinforcement learning and preview-based PID controller

PID控制器 强化学习 控制理论(社会学) 跟踪(教育) 控制器(灌溉) 计算机科学 路径(计算) 控制工程 模型预测控制 人工智能 工程类 控制(管理) 心理学 温度控制 农学 程序设计语言 生物 教育学
作者
Kun Feng,Xu Li,Wenli Li
标识
DOI:10.1177/09544070241287965
摘要

Path-tracking control is a crucial process for autonomous vehicles, ensuring that the vehicle drives safely along the reference path, and the suitable controller parameters ensure the accuracy and stability of this process. To enhance the adaptability of traditional path-tracking controller parameters, this paper proposes an adaptive model predictive control (MPC) controller based on a preview-based PID controller and deep deterministic policy gradient (DDPG) algorithm to achieve adaptive tuning of the controller parameters. Starting with the design of the dynamics tracking error model of the vehicle and the MPC controller. Based on the actor-critic reinforcement learning architecture, the DDPG agent is designed to tune the prediction horizon and weight matrix of the MPC controller. A preview-based PID controller is proposed to improve the efficiency and stability of reinforcement learning and compensate for the error in vehicle modeling. The improved algorithm performance is verified through the simulation scenarios of high-speed lane changing and accelerated overtaking scenarios constructed by MATLAB/Simulink. The results show that the improved algorithm significantly improves the adaptive ability of the traditional MPC controller to time-varying conditions and achieves higher tracking accuracy and stability.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
脑洞疼应助本喵不怂采纳,获得10
2秒前
萧湘发布了新的文献求助10
2秒前
Lucas应助ooorraee采纳,获得10
3秒前
沉默的婴发布了新的文献求助10
3秒前
3秒前
临泉发布了新的文献求助20
4秒前
Sherry99完成签到,获得积分20
4秒前
4秒前
情怀应助狂野忆文采纳,获得10
4秒前
不想做实验完成签到,获得积分10
4秒前
6秒前
6秒前
9秒前
fox199753206发布了新的文献求助10
10秒前
小女发布了新的文献求助10
10秒前
啧啧啧完成签到,获得积分10
11秒前
冯冯完成签到,获得积分10
12秒前
耍酷的夏云应助FIN采纳,获得50
12秒前
jess发布了新的文献求助10
13秒前
情怀应助山柳采纳,获得10
13秒前
轻松水壶应助可乐采纳,获得10
14秒前
15秒前
15秒前
科研通AI5应助啧啧啧采纳,获得10
15秒前
16秒前
16秒前
xingxing发布了新的文献求助10
18秒前
19秒前
19秒前
传奇3应助科研通管家采纳,获得10
20秒前
小蘑菇应助科研通管家采纳,获得10
20秒前
乐乐应助科研通管家采纳,获得10
21秒前
21秒前
充电宝应助科研通管家采纳,获得10
21秒前
科研通AI2S应助科研通管家采纳,获得10
21秒前
桐桐应助科研通管家采纳,获得10
21秒前
21秒前
科研通AI5应助科研通管家采纳,获得10
21秒前
Lucas应助研玲采纳,获得10
21秒前
科研通AI2S应助科研通管家采纳,获得10
21秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Structural Load Modelling and Combination for Performance and Safety Evaluation 1000
Conference Record, IAS Annual Meeting 1977 610
電気学会論文誌D(産業応用部門誌), 141 巻, 11 号 510
Time Matters: On Theory and Method 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3560386
求助须知:如何正确求助?哪些是违规求助? 3134484
关于积分的说明 9407578
捐赠科研通 2834649
什么是DOI,文献DOI怎么找? 1558173
邀请新用户注册赠送积分活动 727933
科研通“疑难数据库(出版商)”最低求助积分说明 716633