Multi-Agent Reinforcement Learning-Based Decision Making for Twin-Vehicles Cooperative Driving in Stochastic Dynamic Highway Environments

强化学习 灵活性(工程) 超车 一般化 计算机科学 适应(眼睛) 钢筋 工程类 人工智能 运输工程 数学 结构工程 统计 光学 物理 数学分析
作者
Siyuan Chen,Meiling Wang,Wenjie Song,Yi Yang,Mengyin Fu
出处
期刊:IEEE Transactions on Vehicular Technology [Institute of Electrical and Electronics Engineers]
卷期号:72 (10): 12615-12627 被引量:3
标识
DOI:10.1109/tvt.2023.3275582
摘要

In the past decade, reinforcement learning (RL) has achieved encouraging results in autonomous driving, especially in well-structured and regulated highway environments. However, few researches pay attention to RL-based multiple-vehicles cooperative driving, which is much more challenging because of dynamic real-time interactions and transient scenarios. This article proposes a Multi-Agent Reinforcement Learning (MARL) based twin-vehicles cooperative driving decision making method which achieves the generalization adaptation of the RL method in highly dynamic highway environments and enhances the flexibility and effectiveness of collaborative decision making system. The proposed fair cooperative MARL method pays equal attention to the individual intelligence and the cooperative performance, and employs a stable estimation method to reduce the propagation of overestimated joint $Q$ -values between agents. Thus, the twin-vehicles system strikes a balance between maintaining formation and free overtaking in dynamic highway environments, to intelligently adapt to different scenarios, such as heavy traffic, loose traffic, even some emergency. Targeted experiments show that our method has strong cooperative performance, also further increases the possibility of creating a harmonious driving environment.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
欢欢发布了新的文献求助10
刚刚
zhang完成签到,获得积分10
刚刚
lilei完成签到,获得积分10
1秒前
青一完成签到 ,获得积分10
1秒前
搬砖美少女完成签到,获得积分10
1秒前
FDSDFSDF完成签到,获得积分10
2秒前
谦让超短裙完成签到,获得积分10
3秒前
3秒前
杨青月完成签到,获得积分10
3秒前
许你晚风凉完成签到,获得积分10
3秒前
欢呼菀完成签到 ,获得积分10
3秒前
偷得浮生半日闲完成签到,获得积分10
4秒前
李雪松完成签到 ,获得积分10
5秒前
车剑锋完成签到,获得积分10
5秒前
布丁完成签到,获得积分10
5秒前
执着手套完成签到,获得积分10
5秒前
5秒前
迷你的雁枫完成签到 ,获得积分10
6秒前
youmuyou完成签到,获得积分10
6秒前
lemshine完成签到,获得积分10
6秒前
Morri完成签到,获得积分10
6秒前
李友健完成签到 ,获得积分10
7秒前
科研醉汉完成签到,获得积分10
7秒前
自然紫山完成签到,获得积分10
7秒前
7秒前
JiegeSCI完成签到,获得积分10
8秒前
Taurus_Ho完成签到,获得积分10
8秒前
Lisztan完成签到,获得积分10
9秒前
标致的方盒完成签到,获得积分10
9秒前
龙仔子完成签到 ,获得积分10
10秒前
sherrinford完成签到,获得积分10
10秒前
莫道桑榆完成签到,获得积分10
10秒前
yy完成签到 ,获得积分10
11秒前
欢欢完成签到,获得积分10
11秒前
12秒前
CHEN.CHENG发布了新的文献求助10
12秒前
12秒前
傅寒天完成签到,获得积分10
12秒前
DRAZ发布了新的文献求助10
13秒前
Changlu发布了新的文献求助10
14秒前
高分求助中
Sustainability in Tides Chemistry 2000
Microlepidoptera Palaearctica, Volumes 1 and 3 - 13 (12-Volume Set) [German] 1122
Дружба 友好报 (1957-1958) 1000
The Data Economy: Tools and Applications 1000
Mantiden - Faszinierende Lauerjäger – Buch gebraucht kaufen 700
PraxisRatgeber Mantiden., faszinierende Lauerjäger. – Buch gebraucht kaufe 700
A Dissection Guide & Atlas to the Rabbit 600
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3099877
求助须知:如何正确求助?哪些是违规求助? 2751333
关于积分的说明 7612942
捐赠科研通 2403282
什么是DOI,文献DOI怎么找? 1275217
科研通“疑难数据库(出版商)”最低求助积分说明 616310
版权声明 599053