清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Simulation of Vehicle Interaction Behavior in Merging Scenarios: A Deep Maximum Entropy- Inverse Reinforcement Learning Method Combined with Game Theory

计算机科学 强化学习 马尔可夫决策过程 过程(计算) 熵(时间箭头) 最大熵原理 人工智能 博弈论 马尔可夫过程 机器学习 模拟 数学 数理经济学 统计 物理 量子力学 操作系统
作者
Wenli Li,Fanke Qiu,Lingxi Li,Yinan Zhang,Kan Wang
出处
期刊:IEEE transactions on intelligent vehicles [Institute of Electrical and Electronics Engineers]
卷期号:9 (1): 1079-1093
标识
DOI:10.1109/tiv.2023.3323138
摘要

Simulation testing based on virtual scenarios can improve the efficiency of safety testing for high-level autonomous vehicles (AVs). In most traffic scenarios, such as merging scenarios, the interactions between vehicles are a game process. Therefore, a critical factor is to accurately simulate the game and interaction processes between the background vehicle (BV) and AV in the test environment. With the increasing availability of natural driving data, a data-driven approach can be introduced to identify the underlying driving behavior patterns in actual driving data. Thus, this paper proposes a data-driven method for modeling BV behavior for AV testing in virtual scenarios. The method describes the vehicle decision process in the merging scenario as a standard Markov decision process (MDP). Based on game theory, we considered the BV as a game subject to illustrate the vehicle interaction process. Furthermore, a deep maximum entropy-inverse reinforcement learning combined with the game matrix is proposed to identify the reward function that describes BV behavior. The obtained reward function is used to design a deep Q-network algorithm to simulate the behavior of BV. Finally, the effectiveness and feasibility of the proposed method are verified by comparing it with natural driving data. Moreover, we performed comparative tests with the other two baseline methods; the results show that the proposed method can accurately simulate the interaction behaviors between vehicles in the virtual scenarios.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
萧水白应助科研通管家采纳,获得10
9秒前
Jasper应助科研通管家采纳,获得10
9秒前
_xySH完成签到 ,获得积分10
24秒前
葶ting完成签到 ,获得积分10
31秒前
35秒前
Lee完成签到 ,获得积分10
43秒前
lijunkyt2025完成签到 ,获得积分10
49秒前
GJ完成签到,获得积分10
58秒前
你博哥完成签到 ,获得积分10
1分钟前
huanghe完成签到,获得积分10
1分钟前
1分钟前
沉沉完成签到 ,获得积分0
1分钟前
lingling完成签到 ,获得积分10
1分钟前
yifanchen应助凌波微步采纳,获得10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
2分钟前
2分钟前
坦率的从波完成签到 ,获得积分10
2分钟前
大水完成签到 ,获得积分10
2分钟前
bkagyin应助Polymer72采纳,获得30
2分钟前
奶糖喵完成签到 ,获得积分10
2分钟前
maodeshu应助饱满一手采纳,获得20
3分钟前
HXL完成签到 ,获得积分10
3分钟前
3分钟前
桐桐应助cc采纳,获得10
3分钟前
zzhui完成签到,获得积分10
3分钟前
凌波微步完成签到,获得积分10
3分钟前
cindyyunjie完成签到,获得积分10
3分钟前
kenchilie完成签到 ,获得积分10
3分钟前
3分钟前
科研通AI2S应助lfj1865采纳,获得10
3分钟前
TT发布了新的文献求助10
3分钟前
科研通AI2S应助科研通管家采纳,获得10
4分钟前
狂野的研究僧应助TT采纳,获得10
4分钟前
4分钟前
渠安完成签到 ,获得积分10
4分钟前
4分钟前
草木发布了新的文献求助10
4分钟前
深情的凝云完成签到 ,获得积分10
4分钟前
高分求助中
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger Heßler, Claudia, Rud 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
Natural History of Mantodea 螳螂的自然史 1000
Glucuronolactone Market Outlook Report: Industry Size, Competition, Trends and Growth Opportunities by Region, YoY Forecasts from 2024 to 2031 800
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
Solution Manual for Strategic Compensation A Human Resource Management Approach 600
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3330484
求助须知:如何正确求助?哪些是违规求助? 2960056
关于积分的说明 8598317
捐赠科研通 2638742
什么是DOI,文献DOI怎么找? 1444495
科研通“疑难数据库(出版商)”最低求助积分说明 669112
邀请新用户注册赠送积分活动 656771