An improved Dueling Deep Q-network with optimizing reward functions for driving decision method

层次分析法 计算机科学 强化学习 规划师 人工智能 动作(物理) 过程(计算) 功能(生物学) 机器学习 运筹学 数学优化 工程类 数学 物理 量子力学 进化生物学 生物 操作系统
作者
Jiaqi Cao,Xiaolan Wang,Yansong Wang,Yongxiang Tian
出处
期刊:Proceedings of the Institution of Mechanical Engineers, Part D: Journal of Automobile Engineering [SAGE]
卷期号:237 (9): 2295-2309 被引量:4
标识
DOI:10.1177/09544070221106037
摘要

Aiming at poor effects and single consideration factors of traditional driving decision-making algorithm in high-speed and complex environment, a method based on improved deep reinforcement learning (DRL) is proposed in this paper. We innovatively design and optimize the reward function of the Dueling Deep Q network (Dueling DQN), and the factors such as safety, comfort, traffic efficiency and altruism are taken into account. The weight of each influencing factor is determined by the Analytic Hierarchy Process (AHP), which makes the influence of each factor on driving behavior decision-making more acceptable. Subsequently, a decision-making model of autonomous vehicles (AVs) is built by using improved Dueling DQN. Furthermore, the action space is enriched and combined with the trajectory planner, so that AVs can take appropriate behaviors in the longitudinal and lateral directions according to the environment. The output of the decision model can be combined with the underlying controller with a view to make the AVs maneuver reasonably. The driving decision-making method in two different traffic scenarios is simulated. Moreover, the improved method compares with other methods. The results illustrate that the improved Dueling DQN can make the AVs take safe, comfortable, efficient, and altruistic behavior.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
天天向上发布了新的文献求助10
1秒前
OuO完成签到,获得积分10
1秒前
2秒前
3秒前
机智的书竹完成签到,获得积分20
7秒前
8秒前
愉快凌晴发布了新的文献求助10
8秒前
9秒前
受伤的靖琪完成签到,获得积分10
11秒前
hx完成签到,获得积分10
12秒前
JIU夭发布了新的文献求助10
13秒前
YJ完成签到,获得积分10
13秒前
16秒前
17秒前
buno应助JIU夭采纳,获得10
18秒前
20秒前
21秒前
21秒前
22秒前
22秒前
Cheryy完成签到,获得积分10
23秒前
zy发布了新的文献求助10
23秒前
应俊完成签到,获得积分10
23秒前
24秒前
朱朱发布了新的文献求助10
25秒前
充电宝应助小沈采纳,获得10
25秒前
YoursALu完成签到,获得积分10
27秒前
buno应助东方欲晓采纳,获得30
29秒前
干啥啥行发布了新的文献求助10
30秒前
30秒前
所所应助朱朱采纳,获得10
31秒前
32秒前
甜心小布丁完成签到,获得积分10
32秒前
淇奥发布了新的文献求助10
32秒前
35秒前
35秒前
刚刚好完成签到,获得积分10
36秒前
KB完成签到,获得积分10
36秒前
nixx发布了新的文献求助10
36秒前
Calvin-funsom发布了新的文献求助10
37秒前
高分求助中
Earth System Geophysics 1000
Co-opetition under Endogenous Bargaining Power 666
Medicina di laboratorio. Logica e patologia clinica 600
Handbook of Marine Craft Hydrodynamics and Motion Control, 2nd Edition 500
Sarcolestes leedsi Lydekker, an ankylosaurian dinosaur from the Middle Jurassic of England 500
《关于整治突出dupin问题的实施意见》(厅字〔2019〕52号) 500
Language injustice and social equity in EMI policies in China 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3212535
求助须知:如何正确求助?哪些是违规求助? 2861467
关于积分的说明 8128885
捐赠科研通 2527394
什么是DOI,文献DOI怎么找? 1361116
科研通“疑难数据库(出版商)”最低求助积分说明 643436
邀请新用户注册赠送积分活动 615753