Attention Enhanced Reinforcement Learning for Multi agent Cooperation

强化学习 计算机科学 稳健性(进化) 分布式计算 图形 趋同(经济学) 操作员(生物学) 网络拓扑 人工智能 理论计算机科学 计算机网络 基因 转录因子 抑制因子 经济 化学 生物化学 经济增长
作者
Zhiqiang Pu,Huimu Wang,Zhen Liu,Jianqiang Yi,Shiguang Wu
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:34 (11): 8235-8249 被引量:24
标识
DOI:10.1109/tnnls.2022.3146858
摘要

In this article, a novel method, called attention enhanced reinforcement learning (AERL), is proposed to address issues including complex interaction, limited communication range, and time-varying communication topology for multi agent cooperation. AERL includes a communication enhanced network (CEN), a graph spatiotemporal long short-term memory network (GST-LSTM), and parameters sharing multi-pseudo critic proximal policy optimization (PS-MPC-PPO). Specifically, CEN based on graph attention mechanism is designed to enlarge the agents' communication range and to deal with complex interaction among the agents. GST-LSTM, which replaces the standard fully connected (FC) operator in LSTM with graph attention operator, is designed to capture the temporal dependence while maintaining the spatial structure learned by CEN. PS-MPC-PPO, which extends proximal policy optimization (PPO) in multi agent systems with parameters' sharing to scale to environments with a large number of agents in training, is designed with multi-pseudo critics to mitigate the bias problem in training and accelerate the convergence process. Simulation results for three groups of representative scenarios including formation control, group containment, and predator-prey games demonstrate the effectiveness and robustness of AERL.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
dr.du完成签到 ,获得积分10
刚刚
归尘发布了新的文献求助10
刚刚
lily发布了新的文献求助10
1秒前
1秒前
科研通AI6应助feixue采纳,获得10
2秒前
终梦发布了新的文献求助10
2秒前
hardtime完成签到,获得积分20
2秒前
kkk完成签到,获得积分10
2秒前
可乐喝九瓶完成签到,获得积分10
3秒前
泡芙发布了新的文献求助10
3秒前
科研战士完成签到,获得积分10
3秒前
华仔应助GongFei采纳,获得10
4秒前
4秒前
BuMAMAHAHA完成签到,获得积分10
4秒前
科研通AI5应助Queena采纳,获得10
5秒前
5秒前
kuaikuai发布了新的文献求助30
5秒前
6秒前
6秒前
优美的书雪完成签到,获得积分20
6秒前
6秒前
Alex应助白桃枝采纳,获得20
7秒前
终梦完成签到,获得积分10
7秒前
7秒前
杨多望发布了新的文献求助10
7秒前
CC完成签到 ,获得积分10
9秒前
fzzf发布了新的文献求助10
9秒前
9秒前
量子星尘发布了新的文献求助10
10秒前
晓薇发布了新的文献求助10
10秒前
顾矜应助kuaikuai采纳,获得10
10秒前
我是老大应助赵珺采纳,获得10
10秒前
科研通AI6应助ni采纳,获得10
10秒前
abner完成签到,获得积分10
12秒前
lwt完成签到,获得积分10
12秒前
Ningning发布了新的文献求助10
12秒前
Yiran发布了新的文献求助10
12秒前
13秒前
哈温完成签到,获得积分10
13秒前
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
SOFT MATTER SERIES Volume 22 Soft Matter in Foods 1000
Zur lokalen Geoidbestimmung aus terrestrischen Messungen vertikaler Schweregradienten 1000
Storie e culture della televisione 500
Selected research on camelid physiology and nutrition 500
《2023南京市住宿行业发展报告》 500
Food Microbiology - An Introduction (5th Edition) 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4884272
求助须知:如何正确求助?哪些是违规求助? 4169600
关于积分的说明 12938186
捐赠科研通 3930023
什么是DOI,文献DOI怎么找? 2156406
邀请新用户注册赠送积分活动 1174785
关于科研通互助平台的介绍 1079562