Cooperative Multi-agent Control Using Deep Reinforcement Learning

强化学习 计算机科学 时差学习 一套 人工智能 控制(管理) 机器学习 历史 考古
作者
Jayesh K. Gupta,Maxim Egorov,Mykel J. Kochenderfer
出处
期刊:Lecture Notes in Computer Science 卷期号:: 66-83 被引量:599
标识
DOI:10.1007/978-3-319-71682-4_5
摘要

This work considers the problem of learning cooperative policies in complex, partially observable domains without explicit communication. We extend three classes of single-agent deep reinforcement learning algorithms based on policy gradient, temporal-difference error, and actor-critic methods to cooperative multi-agent systems. To effectively scale these algorithms beyond a trivial number of agents, we combine them with a multi-agent variant of curriculum learning. The algorithms are benchmarked on a suite of cooperative control tasks, including tasks with discrete and continuous actions, as well as tasks with dozens of cooperating agents. We report the performance of the algorithms using different neural architectures, training procedures, and reward structures. We show that policy gradient methods tend to outperform both temporal-difference and actor-critic methods and that curriculum learning is vital to scaling reinforcement learning algorithms in complex multi-agent domains.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
xiaodu20230228完成签到 ,获得积分10
1秒前
3秒前
3秒前
4秒前
Acc完成签到,获得积分10
5秒前
白华苍松发布了新的文献求助20
5秒前
不会学习的小郭完成签到 ,获得积分10
5秒前
淡然白安发布了新的文献求助10
6秒前
它山凡溪寺完成签到 ,获得积分10
7秒前
细心机器猫完成签到,获得积分10
7秒前
7秒前
满当当发布了新的文献求助10
7秒前
8秒前
haoxin发布了新的文献求助10
8秒前
ylh发布了新的文献求助10
9秒前
Hello应助拼搏向上采纳,获得30
9秒前
10秒前
10秒前
多喝废水完成签到 ,获得积分10
11秒前
cy完成签到,获得积分10
11秒前
郭泓嵩完成签到,获得积分10
12秒前
林途发布了新的文献求助10
12秒前
今天鱼怎么样给今天鱼怎么样的求助进行了留言
12秒前
13秒前
科研通AI2S应助科研通管家采纳,获得10
14秒前
科研通AI2S应助科研通管家采纳,获得10
14秒前
ding应助科研通管家采纳,获得10
14秒前
星希应助科研通管家采纳,获得10
14秒前
YXH发布了新的文献求助10
14秒前
小二郎应助科研通管家采纳,获得10
14秒前
深情安青应助科研通管家采纳,获得10
14秒前
14秒前
14秒前
上官若男应助guangwow采纳,获得10
15秒前
西门明雪完成签到,获得积分10
17秒前
三月七发布了新的文献求助10
17秒前
17秒前
wsw完成签到,获得积分10
17秒前
haoxin完成签到,获得积分10
18秒前
雾非雾完成签到,获得积分10
18秒前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
An Introduction to Geographical and Urban Economics: A Spiky World Book by Charles van Marrewijk, Harry Garretsen, and Steven Brakman 500
Diagnostic immunohistochemistry : theranostic and genomic applications 6th Edition 500
Chen Hansheng: China’s Last Romantic Revolutionary 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3151736
求助须知:如何正确求助?哪些是违规求助? 2803153
关于积分的说明 7852024
捐赠科研通 2460525
什么是DOI,文献DOI怎么找? 1309844
科研通“疑难数据库(出版商)”最低求助积分说明 629061
版权声明 601760