Cooperative bus holding and stop-skipping: A deep reinforcement learning framework

强化学习 计算机科学 车头时距 可观测性 交叉口(航空) 国家(计算机科学) 功能(生物学) 事件(粒子物理) 工程类 人工智能 模拟 运输工程 算法 数学 应用数学 进化生物学 生物 物理 量子力学
作者
Joseph Rodriguez,Haris N. Koutsopoulos,Shenhao Wang,Jinhua Zhao
出处
期刊:Transportation Research Part C-emerging Technologies [Elsevier]
卷期号:155: 104308-104308 被引量:5
标识
DOI:10.1016/j.trc.2023.104308
摘要

The bus control problem that combines holding and stop-skipping strategies is formulated as a multi-agent reinforcement learning (MARL) problem. Traditional MARL methods, designed for settings with joint action-taking, are incompatible with the asynchronous nature of at-stop control tasks. On the other hand, using a fully decentralized approach leads to environment non-stationarity, since the state transition of an individual agent may be distorted by the actions of other agents. To address it, we propose a design of the state and reward function that increases the observability of the impact of agents’ actions during training. An event-based mesoscopic simulation model is built to train the agents. We evaluate the proposed approach in a case study with a complex route from the Chicago transit network. The proposed method is compared to a standard headway-based control and a policy trained with MARL but with no cooperative learning. The results show that the proposed method not only improves level of service but it is also more robust towards uncertainties in operations such as travel times and operator compliance with the recommended action.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
大模型应助huanir99采纳,获得10
刚刚
pzhazha完成签到,获得积分10
刚刚
感动新烟发布了新的文献求助10
刚刚
1秒前
1秒前
王润完成签到,获得积分10
1秒前
1秒前
活在当下发布了新的文献求助30
3秒前
天天快乐应助mengyuhuan采纳,获得10
3秒前
所所应助耶zyf采纳,获得10
4秒前
5秒前
葡吉发布了新的文献求助10
5秒前
Jasper应助燕子采纳,获得10
5秒前
jixiangwansui完成签到,获得积分10
5秒前
魔幻小白菜完成签到 ,获得积分10
6秒前
狂野悟空发布了新的文献求助10
6秒前
爆米花应助Zeal采纳,获得10
7秒前
7秒前
7秒前
7秒前
Charles发布了新的文献求助10
8秒前
zz完成签到,获得积分10
8秒前
Severan完成签到,获得积分10
8秒前
科研通AI5应助Chen采纳,获得10
8秒前
8秒前
NexusExplorer应助莉莉采纳,获得10
9秒前
9秒前
pluto应助ajc采纳,获得10
9秒前
pny发布了新的文献求助10
10秒前
10秒前
yangyajie发布了新的文献求助10
10秒前
领导范儿应助风前往采纳,获得10
12秒前
打打应助活在当下采纳,获得10
12秒前
haifang完成签到,获得积分10
12秒前
12秒前
脑洞疼应助成子采纳,获得10
12秒前
洁净雅容完成签到,获得积分10
13秒前
13秒前
anny2022发布了新的文献求助10
13秒前
科研通AI5应助感动城采纳,获得10
13秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Comprehensive Computational Chemistry 1000
Kelsen’s Legacy: Legal Normativity, International Law and Democracy 1000
Conference Record, IAS Annual Meeting 1977 610
Interest Rate Modeling. Volume 3: Products and Risk Management 600
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3552993
求助须知:如何正确求助?哪些是违规求助? 3129046
关于积分的说明 9380452
捐赠科研通 2828221
什么是DOI,文献DOI怎么找? 1554886
邀请新用户注册赠送积分活动 725656
科研通“疑难数据库(出版商)”最低求助积分说明 715112