Multi-UAV Cooperative Short-Range Combat via Attention-Based Reinforcement Learning using Individual Reward Shaping

强化学习 计算机科学 航程(航空) 光学(聚焦) 功能(生物学) 人工智能 动作(物理) 分布式计算 工程类 量子力学 进化生物学 生物 光学 物理 航空航天工程
作者
Tianle Zhang,Tenghai Qiu,Zhen Liu,Zhiqiang Pu,Jianqiang Yi,Jinying Zhu,Ruiguang Hu
标识
DOI:10.1109/iros47612.2022.9982096
摘要

In this paper, we propose a novel distributed method based on attention-based deep reinforcement learning using individual reward shaping, for multiple unmanned aerial vehicles (UAVs) cooperative short-range combat mission. Specifically, a two-level attention distributed policy, composed of observation-level and communication-level attention networks, is designed to enable each UAV to selectively focus on important environmental features and messages, for enhancing the effectiveness of the cooperative policy. Moreover, due to the high complexity and stochasticity of the UAV combat mission, the learning of UAVs is tricky and low efficient. To embed knowledge to accelerate the policy learning, a potential-based individual reward function is constructed by implicitly translating the individual reward into the specific form of dynamic action potentials. In addition, an actor-critic training algorithm based on the centralized training and decentralized execution framework is adopted to train the policy network of UAV maneuver decision. We build a three-dimensional UAV simulation and training platform based on Unity for multi-UAV short-range combat missions. Simulation results demonstrate the effectiveness of the proposed method and the superiority of the attention policy and individual reward shaping.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Liumingyu完成签到,获得积分10
5秒前
kexing完成签到 ,获得积分10
9秒前
听寒完成签到,获得积分10
13秒前
牧小妮完成签到,获得积分10
21秒前
Liumingyu发布了新的文献求助10
22秒前
传奇3应助shan采纳,获得10
27秒前
Ferry完成签到 ,获得积分10
29秒前
光头大叔完成签到 ,获得积分10
30秒前
31秒前
韦韦完成签到 ,获得积分10
37秒前
我要读博士完成签到 ,获得积分10
38秒前
小AB发布了新的文献求助10
38秒前
聪慧的石头完成签到,获得积分10
39秒前
上官枫完成签到 ,获得积分10
39秒前
愤怒的苗条完成签到 ,获得积分10
46秒前
47秒前
poki发布了新的文献求助10
52秒前
zhengyue2233完成签到,获得积分10
52秒前
CapQing完成签到,获得积分10
56秒前
shunlimaomi完成签到 ,获得积分10
58秒前
Xiaoab完成签到,获得积分10
1分钟前
tmobiusx完成签到,获得积分10
1分钟前
CodeCraft应助shan采纳,获得10
1分钟前
就叫烨烨完成签到,获得积分10
1分钟前
陈不沉完成签到 ,获得积分10
1分钟前
1分钟前
yydlt完成签到,获得积分10
1分钟前
舒适涵山完成签到,获得积分10
1分钟前
1分钟前
xiadongbj完成签到,获得积分10
1分钟前
王冬瓜完成签到,获得积分10
1分钟前
潇洒可兰完成签到,获得积分10
1分钟前
HanyuYuzuru发布了新的文献求助10
1分钟前
汕头凯奇完成签到,获得积分10
1分钟前
1分钟前
1分钟前
刘秀的猫咪完成签到 ,获得积分10
1分钟前
啊蒙发布了新的文献求助10
1分钟前
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Handbook of pharmaceutical excipients, Ninth edition 5000
Digital Twins of Advanced Materials Processing 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
Polymorphism and polytypism in crystals 1000
Social Cognition: Understanding People and Events 800
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6028429
求助须知:如何正确求助?哪些是违规求助? 7690535
关于积分的说明 16186531
捐赠科研通 5175597
什么是DOI,文献DOI怎么找? 2769599
邀请新用户注册赠送积分活动 1753051
关于科研通互助平台的介绍 1638822