已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Multi-Agent Deep Reinforcement Learning for Large-Scale Traffic Signal Control

强化学习 计算机科学 稳健性(进化) 可扩展性 可观测性 分布式计算 人工神经网络 人工智能 数学 生物化学 化学 数据库 应用数学 基因
作者
Tianshu Chu,Jie Wang,Lara Codecà,Zhaojian Li
出处
期刊:IEEE Transactions on Intelligent Transportation Systems [Institute of Electrical and Electronics Engineers]
卷期号:21 (3): 1086-1095 被引量:691
标识
DOI:10.1109/tits.2019.2901791
摘要

Reinforcement learning (RL) is a promising data-driven approach for adaptive traffic signal control (ATSC) in complex urban traffic networks, and deep neural networks further enhance its learning power. However, the centralized RL is infeasible for large-scale ATSC due to the extremely high dimension of the joint action space. The multi-agent RL (MARL) overcomes the scalability issue by distributing the global control to each local RL agent, but it introduces new challenges: now, the environment becomes partially observable from the viewpoint of each local agent due to limited communication among agents. Most existing studies in MARL focus on designing efficient communication and coordination among traditional Q-learning agents. This paper presents, for the first time, a fully scalable and decentralized MARL algorithm for the state-of-the-art deep RL agent, advantage actor critic (A2C), within the context of ATSC. In particular, two methods are proposed to stabilize the learning procedure, by improving the observability and reducing the learning difficulty of each local agent. The proposed multi-agent A2C is compared against independent A2C and independent Q-learning algorithms, in both a large synthetic traffic grid and a large real-world traffic network of Monaco city, under simulated peak-hour traffic dynamics. The results demonstrate its optimality, robustness, and sample efficiency over the other state-of-the-art decentralized MARL algorithms.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
Rylynn完成签到,获得积分10
1秒前
半夏完成签到 ,获得积分10
3秒前
兰贵人发布了新的文献求助10
4秒前
NeuroYan发布了新的文献求助10
5秒前
6秒前
热情的听安完成签到,获得积分10
6秒前
阔达的秀发完成签到,获得积分10
7秒前
9秒前
Jasper应助阔达的秀发采纳,获得10
9秒前
Milesgao发布了新的文献求助20
10秒前
所所应助宋莉雯采纳,获得10
11秒前
mochi发布了新的文献求助10
12秒前
12秒前
青黛完成签到,获得积分10
13秒前
不辣的完成签到 ,获得积分10
17秒前
曹贲发布了新的文献求助10
18秒前
monair完成签到 ,获得积分10
20秒前
20秒前
21秒前
清风完成签到 ,获得积分10
24秒前
丁宇卓完成签到 ,获得积分10
25秒前
666完成签到 ,获得积分10
28秒前
C_Cppp完成签到 ,获得积分10
30秒前
sptyzl完成签到 ,获得积分10
30秒前
mochi发布了新的文献求助10
33秒前
曹贲完成签到,获得积分10
33秒前
燕知南完成签到,获得积分10
35秒前
37秒前
花椒泡茶完成签到 ,获得积分10
37秒前
暗夜轰炸机完成签到 ,获得积分10
37秒前
本尼脸上褶子完成签到 ,获得积分10
37秒前
123完成签到 ,获得积分10
39秒前
顾矜应助薛定谔的量子喵采纳,获得10
40秒前
小燕子完成签到 ,获得积分10
40秒前
jeronimo完成签到,获得积分10
44秒前
苇一完成签到,获得积分10
44秒前
樱桃完成签到,获得积分10
45秒前
46秒前
高分求助中
Continuum thermodynamics and material modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 2000
Applications of Emerging Nanomaterials and Nanotechnology 1111
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Les Mantodea de Guyane Insecta, Polyneoptera 1000
工业结晶技术 880
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3491218
求助须知:如何正确求助?哪些是违规求助? 3077861
关于积分的说明 9150845
捐赠科研通 2770369
什么是DOI,文献DOI怎么找? 1520305
邀请新用户注册赠送积分活动 704552
科研通“疑难数据库(出版商)”最低求助积分说明 702253