Multi-Agent Actor-Critic with Hierarchical Graph Attention Network

计算机科学 强化学习 可转让性 人工智能 图形 注意力网络 机器学习 代表(政治) 理论计算机科学 政治学 政治 罗伊特 法学
作者
Heechang Ryu,Hayong Shin,Jinkyoo Park
出处
期刊:Cornell University - arXiv 被引量:2
标识
DOI:10.48550/arxiv.1909.12557
摘要

Most previous studies on multi-agent reinforcement learning focus on deriving decentralized and cooperative policies to maximize a common reward and rarely consider the transferability of trained policies to new tasks. This prevents such policies from being applied to more complex multi-agent tasks. To resolve these limitations, we propose a model that conducts both representation learning for multiple agents using hierarchical graph attention network and policy learning using multi-agent actor-critic. The hierarchical graph attention network is specially designed to model the hierarchical relationships among multiple agents that either cooperate or compete with each other to derive more advanced strategic policies. Two attention networks, the inter-agent and inter-group attention layers, are used to effectively model individual and group level interactions, respectively. The two attention networks have been proven to facilitate the transfer of learned policies to new tasks with different agent compositions and allow one to interpret the learned strategies. Empirically, we demonstrate that the proposed model outperforms existing methods in several mixed cooperative and competitive tasks.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
昏睡的香菇完成签到,获得积分10
刚刚
超越俗尘完成签到,获得积分10
刚刚
大脚丫发布了新的文献求助10
刚刚
酷炫素发布了新的文献求助10
1秒前
共享精神应助小徐医生采纳,获得10
2秒前
2秒前
4秒前
奇遇发布了新的文献求助10
4秒前
4秒前
生动听筠发布了新的文献求助10
4秒前
5秒前
顾海东发布了新的文献求助10
7秒前
斯文败类应助酷炫素采纳,获得10
7秒前
ding应助大成子采纳,获得10
7秒前
沙拉酱完成签到 ,获得积分10
8秒前
JamesPei应助子铭采纳,获得10
8秒前
复杂大象完成签到,获得积分10
9秒前
Akim应助闪闪的绮波采纳,获得10
9秒前
10秒前
10秒前
科研小破白菜应助韦老虎采纳,获得10
11秒前
科研通AI5应助B2S3Cl3采纳,获得10
11秒前
安静发布了新的文献求助10
11秒前
深情安青应助Amen采纳,获得10
15秒前
科研通AI5应助shuangcheng采纳,获得10
15秒前
NeverdieTTJ完成签到,获得积分10
15秒前
16秒前
李健应助pdx666采纳,获得10
16秒前
科研通AI5应助猫猫熊采纳,获得10
17秒前
高大甜瓜发布了新的文献求助10
17秒前
Hello应助acutelily采纳,获得10
17秒前
生动听筠完成签到,获得积分20
17秒前
18秒前
pluto应助科研通管家采纳,获得10
20秒前
科研通AI5应助科研通管家采纳,获得10
20秒前
汉堡包应助小马采纳,获得10
20秒前
852应助科研通管家采纳,获得10
20秒前
搜集达人应助科研通管家采纳,获得10
20秒前
酷波er应助科研通管家采纳,获得10
20秒前
烟花应助淡然蜗牛采纳,获得10
20秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Structural Load Modelling and Combination for Performance and Safety Evaluation 1000
Conference Record, IAS Annual Meeting 1977 610
電気学会論文誌D(産業応用部門誌), 141 巻, 11 号 510
Time Matters: On Theory and Method 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3560301
求助须知:如何正确求助?哪些是违规求助? 3134420
关于积分的说明 9407421
捐赠科研通 2834549
什么是DOI,文献DOI怎么找? 1558171
邀请新用户注册赠送积分活动 727912
科研通“疑难数据库(出版商)”最低求助积分说明 716615