Cascaded Attention: Adaptive and Gated Graph Attention Network for Multiagent Reinforcement Learning

计算机科学 注意力网络 强化学习 图形 多样性(控制论) 人工智能 简单(哲学) 多智能体系统 机器学习 理论计算机科学 分布式计算 认识论 哲学
作者
Shuhan Qi,Xinhao Huang,Peixi Peng,Xuzhong Huang,Jiajia Zhang,Xuan Wang
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:35 (3): 3769-3779 被引量:6
标识
DOI:10.1109/tnnls.2022.3197918
摘要

Modeling the interactive relationships of agents is critical to improving the collaborative capability of a multiagent system. Some methods model these by predefined rules. However, due to the nonstationary problem, the interactive relationship changes over time and cannot be well captured by rules. Other methods adopt a simple mechanism such as an attention network to select the neighbors the current agent should collaborate with. However, in large-scale multiagent systems, collaborative relationships are too complicated to be described by a simple attention network. We propose an adaptive and gated graph attention network (AGGAT), which models the interactive relationships between agents in a cascaded manner. In the AGGAT, we first propose a graph-based hard attention network that roughly filters irrelevant agents. Then, normal soft attention is adopted to decide the importance of each neighbor. Finally, gated attention further refines the collaborative relationship of agents. By using cascaded attention, the collaborative relationship of agents is precisely learned in a coarse-to-fine style. Extensive experiments are conducted on a variety of cooperative tasks. The results indicate that our proposed method outperforms state-of-the-art baselines.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
逗逗完成签到,获得积分10
刚刚
lijs完成签到,获得积分10
刚刚
刚刚
YY发布了新的文献求助10
1秒前
现代大米发布了新的文献求助10
1秒前
Qin完成签到,获得积分20
1秒前
冷杨发布了新的文献求助30
1秒前
1秒前
1秒前
踏实月亮完成签到,获得积分10
1秒前
勤恳的闭月完成签到,获得积分10
1秒前
aANDb完成签到,获得积分10
2秒前
meng发布了新的文献求助10
2秒前
2秒前
thesky发布了新的文献求助10
3秒前
orixero应助啊实打实的采纳,获得10
3秒前
Owen应助lucky采纳,获得10
3秒前
流露完成签到,获得积分10
3秒前
奶昔发布了新的文献求助10
3秒前
王泽坤发布了新的文献求助10
3秒前
大个应助123456采纳,获得20
4秒前
小蘑菇应助紧张的世德采纳,获得10
4秒前
4秒前
Silhouette发布了新的文献求助10
5秒前
Qin发布了新的文献求助10
5秒前
5秒前
王KKK发布了新的文献求助10
6秒前
YY完成签到,获得积分10
6秒前
6秒前
7秒前
7秒前
科研小子完成签到,获得积分10
8秒前
发顶刊发布了新的文献求助10
9秒前
量子星尘发布了新的文献求助10
9秒前
xueshu发布了新的文献求助10
9秒前
thesky完成签到,获得积分10
10秒前
dx完成签到,获得积分10
10秒前
10秒前
Clover04发布了新的文献求助10
11秒前
11秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
《药学类医疗服务价格项目立项指南(征求意见稿)》 880
Stop Talking About Wellbeing: A Pragmatic Approach to Teacher Workload 800
花の香りの秘密―遺伝子情報から機能性まで 800
3rd Edition Group Dynamics in Exercise and Sport Psychology New Perspectives Edited By Mark R. Beauchamp, Mark Eys Copyright 2025 600
1st Edition Sports Rehabilitation and Training Multidisciplinary Perspectives By Richard Moss, Adam Gledhill 600
Terminologia Embryologica 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5619177
求助须知:如何正确求助?哪些是违规求助? 4703952
关于积分的说明 14925213
捐赠科研通 4759305
什么是DOI,文献DOI怎么找? 2550439
邀请新用户注册赠送积分活动 1513156
关于科研通互助平台的介绍 1474401