BMG-Q: Localized Bipartite Match Graph Attention Q-Learning for Ride-Pooling Order Dispatch

联营 二部图 订单(交换) 图形 组合数学 人工智能 计算机科学 数学 经济 财务
作者
Yulong Hu,Siyuan Feng,Sen Li
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2501.13448
摘要

This paper introduces Localized Bipartite Match Graph Attention Q-Learning (BMG-Q), a novel Multi-Agent Reinforcement Learning (MARL) algorithm framework tailored for ride-pooling order dispatch. BMG-Q advances ride-pooling decision-making process with the localized bipartite match graph underlying the Markov Decision Process, enabling the development of novel Graph Attention Double Deep Q Network (GATDDQN) as the MARL backbone to capture the dynamic interactions among ride-pooling vehicles in fleet. Our approach enriches the state information for each agent with GATDDQN by leveraging a localized bipartite interdependence graph and enables a centralized global coordinator to optimize order matching and agent behavior using Integer Linear Programming (ILP). Enhanced by gradient clipping and localized graph sampling, our GATDDQN improves scalability and robustness. Furthermore, the inclusion of a posterior score function in the ILP captures the online exploration-exploitation trade-off and reduces the potential overestimation bias of agents, thereby elevating the quality of the derived solutions. Through extensive experiments and validation, BMG-Q has demonstrated superior performance in both training and operations for thousands of vehicle agents, outperforming benchmark reinforcement learning frameworks by around 10% in accumulative rewards and showing a significant reduction in overestimation bias by over 50%. Additionally, it maintains robustness amidst task variations and fleet size changes, establishing BMG-Q as an effective, scalable, and robust framework for advancing ride-pooling order dispatch operations.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
LshZzz完成签到,获得积分20
刚刚
chessman完成签到,获得积分10
1秒前
2秒前
2秒前
李禾和完成签到,获得积分10
2秒前
太子发布了新的文献求助10
2秒前
丁一完成签到,获得积分10
2秒前
123完成签到,获得积分10
2秒前
m木宁木蒙发布了新的文献求助10
2秒前
丘比特应助DT采纳,获得10
3秒前
任性若山发布了新的文献求助10
3秒前
3秒前
秋作完成签到,获得积分10
3秒前
张afsbdtw完成签到,获得积分10
3秒前
3秒前
小巧安柏完成签到,获得积分10
4秒前
乐乐应助喵卫五更采纳,获得10
4秒前
5秒前
5秒前
科研通AI5应助accept来采纳,获得10
5秒前
量子星尘发布了新的文献求助10
6秒前
简柠完成签到,获得积分10
7秒前
大模型应助可爱怀莲采纳,获得10
7秒前
单薄忆梅发布了新的文献求助10
7秒前
小逸完成签到 ,获得积分20
7秒前
四号玩家发布了新的文献求助10
7秒前
gwp1223发布了新的文献求助40
8秒前
沉默的莞发布了新的文献求助10
8秒前
含蓄的大船完成签到,获得积分10
8秒前
李健应助22222采纳,获得10
9秒前
zho发布了新的文献求助10
9秒前
10秒前
宋博完成签到,获得积分10
10秒前
10秒前
louxiaohan完成签到,获得积分10
10秒前
纯真冰露完成签到,获得积分10
10秒前
滴滴完成签到 ,获得积分10
10秒前
10秒前
晓书斋完成签到,获得积分10
10秒前
kjh完成签到,获得积分10
11秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
The First Nuclear Era: The Life and Times of a Technological Fixer 500
ALUMINUM STANDARDS AND DATA 500
Walter Gilbert: Selected Works 500
岡本唐貴自伝的回想画集 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3667657
求助须知:如何正确求助?哪些是违规求助? 3226188
关于积分的说明 9768281
捐赠科研通 2936167
什么是DOI,文献DOI怎么找? 1608152
邀请新用户注册赠送积分活动 759520
科研通“疑难数据库(出版商)”最低求助积分说明 735404