Toward personalized decision making for autonomous vehicles: A constrained multi-objective reinforcement learning technique

强化学习 计算机科学 贝尔曼方程 偏爱 约束(计算机辅助设计) 数学优化 帕累托原理 人工智能 状态空间 动作(物理) 空格(标点符号) 机器学习 工程类 数学 物理 操作系统 统计 机械工程 量子力学
作者
Xiangkun He,Chen Lv
出处
期刊:Transportation Research Part C-emerging Technologies [Elsevier BV]
卷期号:156: 104352-104352 被引量:14
标识
DOI:10.1016/j.trc.2023.104352
摘要

Reinforcement learning promises to provide a state-of-the-art solution to the decision making problem of autonomous driving. Nonetheless, numerous real-world decision making problems involve balancing multiple conflicting or competing objectives. In addition, passengers may typically prefer to explore diversified driving modes through their specific preferences (i.e., relative importance of different objectives). Taking into account these demands, traditional reinforcement learning algorithms with applications in personalized self-driving vehicles remain challenging. Consequently, here we present a novel constrained multi-objective reinforcement learning technique for personalized decision making in autonomous driving, with the goal of learning a single model for Pareto optimal policies across the space of all possible user preferences. Specifically, a nonlinear constraint incorporating a user-specified preference and a vectorized action–value function is introduced to ensure both diversity in learned decision behaviors and efficient alignment between the user-specified preference and the corresponding optimal policy. Additionally, a constrained multi-objective actor–critic approach is advanced to approximate the Pareto optimal policies for any user-specified preferences while adhering to the nonlinear constraint. Finally, the proposed personalized decision making scheme for autonomous driving is assessed in a highway on-ramp merging scenario with dynamic traffic flows. The results demonstrate the effectiveness of our method by comparing it with classical and state-of-the-art baselines.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
无际的星空下完成签到,获得积分10
刚刚
大力的灵雁应助吴慧琼采纳,获得10
刚刚
23202完成签到,获得积分10
刚刚
珂颜堂AI完成签到,获得积分10
刚刚
小马甲应助吴慧琼采纳,获得10
刚刚
深情安青应助zzzzz采纳,获得10
刚刚
潇潇发布了新的文献求助10
1秒前
zhou完成签到,获得积分10
1秒前
yumeng完成签到 ,获得积分10
1秒前
大观天下发布了新的文献求助10
1秒前
2秒前
2秒前
2秒前
hwj完成签到,获得积分10
2秒前
田様应助cheria采纳,获得10
2秒前
2秒前
倒头就睡发布了新的文献求助30
2秒前
3秒前
ShengQ完成签到,获得积分10
3秒前
3秒前
stone发布了新的文献求助10
3秒前
34299完成签到,获得积分10
3秒前
4秒前
沉默寻凝完成签到,获得积分10
4秒前
我是老大应助周四一采纳,获得10
4秒前
小书包完成签到,获得积分10
5秒前
Joy完成签到,获得积分10
5秒前
qh发布了新的文献求助10
5秒前
35766完成签到,获得积分10
5秒前
zhou发布了新的文献求助10
5秒前
6秒前
大模型应助猪哥采纳,获得10
6秒前
桐桐应助顺利手套采纳,获得10
6秒前
buguxx完成签到,获得积分10
6秒前
7秒前
快乐小瑶发布了新的文献求助10
7秒前
风清扬发布了新的文献求助10
7秒前
7秒前
感冒药完成签到 ,获得积分10
7秒前
情怀应助暮秋时雨采纳,获得10
8秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
機能性マイクロ細孔・マイクロ流体デバイスを利用した放射性核種の 分離・溶解・凝集挙動に関する研究 1000
卤化钙钛矿人工突触的研究 1000
Engineering for calcareous sediments : proceedings of the International Conference on Calcareous Sediments, Perth 15-18 March 1988 / edited by R.J. Jewell, D.C. Andrews 1000
Wolffs Headache and Other Head Pain 9th Edition 1000
Continuing Syntax 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6257839
求助须知:如何正确求助?哪些是违规求助? 8079993
关于积分的说明 16879999
捐赠科研通 5329984
什么是DOI,文献DOI怎么找? 2837535
邀请新用户注册赠送积分活动 1814844
关于科研通互助平台的介绍 1669011