Safe Deep Reinforcement Learning-Based Constrained Optimal Control Scheme for HEV Energy Management

强化学习 计算机科学 行驶循环 最优控制 能源管理 适应性 燃料效率 电动汽车 数学优化 人工神经网络 控制(管理) 人工智能 控制工程 控制理论(社会学) 功率(物理) 工程类 能量(信号处理) 汽车工程 数学 统计 生态学 生物 物理 量子力学
作者
Zemin Eitan Liu,Quan Zhou,Yanfei Li,Shijin Shuai,Hongming Xu
出处
期刊:IEEE Transactions on Transportation Electrification 卷期号:9 (3): 4278-4293 被引量:22
标识
DOI:10.1109/tte.2023.3240430
摘要

Considering physical constraints in online optimization and training safety is a challenge for the implementation of the deep reinforcement learning (DRL) algorithm. Especially for the nonlinear system, the mapping relationship between the output action of the agent and the control signals is difficult to obtain. This article proposes a novel DRL framework for online optimization in energy management of a power-split hybrid electric vehicle (HEV), which combines a neural network (NN)-based multiconstraints optimal strategy and a rule-based-restraints system (RBRS). The proposed method named reward-directed policy optimization (RDPO) adopts the exterior point method (EPM) and curriculum learning (CL) to direct the agent to recognize and avoid irrational control signals and optimize the fuel economy. The energy management strategy (EMS) considering fuel consumption minimization and irrational control signals' avoidance is optimized by training the agent through the world light vehicle test cycle (WLTC). A competitive fuel economy, 4.495 L/100 km, is achieved with no irrational control signals. Based on the online adaptability evaluation conducted, the fuel consumption of the vehicle under the New European Driving Cycle (NEDC) and the China Typical Urban Driving Cycle (CTUDC) has been reduced to 4.113 L/100 km and 3.221 L/100 km, respectively, with no irrational control signals. The superiority in optimization, calculation efficiency, and safety is verified through comparisons with various DRL agents.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
婷婷完成签到,获得积分10
刚刚
Lucas应助air233采纳,获得10
刚刚
雪山飞龙发布了新的文献求助10
刚刚
1秒前
Ricewind完成签到,获得积分20
1秒前
2秒前
沉淀发布了新的文献求助50
3秒前
科目三应助鲤鱼幻香采纳,获得10
3秒前
无奈迎波完成签到,获得积分10
3秒前
le发布了新的文献求助10
4秒前
猫和老鼠发布了新的文献求助10
5秒前
5秒前
羊羊羊发布了新的文献求助10
5秒前
Ricewind发布了新的文献求助10
6秒前
fSSXMSSN完成签到,获得积分10
7秒前
神勇代荷应助蓝天采纳,获得10
8秒前
ding应助任性的山芙采纳,获得10
8秒前
8秒前
搞怪的紫雪完成签到,获得积分10
8秒前
夜捕白日梦完成签到,获得积分10
8秒前
睡个懒觉8完成签到 ,获得积分10
10秒前
脑洞疼应助沉淀采纳,获得50
11秒前
李健应助1111采纳,获得10
11秒前
12秒前
小马甲应助李新宇采纳,获得10
15秒前
边城小子完成签到,获得积分10
15秒前
15秒前
iNk应助泥嚎采纳,获得20
16秒前
雪山飞龙发布了新的文献求助30
16秒前
岸上牛完成签到,获得积分10
16秒前
air233完成签到,获得积分10
18秒前
贪玩的秋柔应助鱼oo采纳,获得10
18秒前
19秒前
19秒前
Jasper应助云仔采纳,获得10
19秒前
欣喜小之完成签到,获得积分10
20秒前
NexusExplorer应助小猪采纳,获得10
21秒前
22秒前
淡淡的小翠完成签到,获得积分10
22秒前
小马甲应助羊羊羊采纳,获得10
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cronologia da história de Macau 1600
Decentring Leadership 1000
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
BRITTLE FRACTURE IN WELDED SHIPS 1000
Intentional optical interference with precision weapons (in Russian) Преднамеренные оптические помехи высокоточному оружию 1000
Atlas of Anatomy 5th original digital 2025的PDF高清电子版(非压缩版,大小约400-600兆,能更大就更好了) 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 计算机科学 化学工程 生物化学 物理 复合材料 内科学 催化作用 物理化学 光电子学 细胞生物学 基因 电极 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6184364
求助须知:如何正确求助?哪些是违规求助? 8011653
关于积分的说明 16663915
捐赠科研通 5283697
什么是DOI,文献DOI怎么找? 2816564
邀请新用户注册赠送积分活动 1796376
关于科研通互助平台的介绍 1660883