Military Decision Support with Actor and Critic Reinforcement Learning Agents

强化学习 钢筋 决策支持系统 心理学 计算机科学 人工智能 社会心理学
作者
Jungmok Ma
出处
期刊:Defence Science Journal [Defence Scientific Information and Documentation Centre]
卷期号:74 (3): 389-398
标识
DOI:10.14429/dsj.74.18864
摘要

While the recent advanced military operational concept requires an intelligent support of command and control, Reinforcement Learning (RL) has not been actively studied in the military domain. This study points out the limitations of RL for military applications from literature review and aims at improving the understanding of RL for military decision support under the limitations. Most of all, the black box characteristic of Deep RL makes the internal process difficult to understand in addition to complex simulation tools. A scalable weapon selection RL framework is built which can be solved either by a tabular form or a neural network form. The transition of the Deep Q-Network (DQN) solution to the tabular form makes it easier to compare the result to the Q-learning solution. Furthermore, rather than using one or two RL models selectively as before, RL models are divided as an actor and a critic, and systematically compared. A random agent, Q-learning and DQN agents as a critic, a Policy Gradient (PG) agent as an actor, Trust Region Policy Optimization (TRPO) and Proximal Policy Optimization (PPO) agents as an actor-critic approach are designed, trained, and tested. The performance results show that the trained DQN and PPO agents are the best decision supporter candidates for the weapon selection RL framework.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
张引完成签到 ,获得积分10
1秒前
萌兰完成签到 ,获得积分10
2秒前
柳大宝发布了新的文献求助10
2秒前
Raymon33发布了新的文献求助10
3秒前
cici发布了新的文献求助10
4秒前
5秒前
沉静的不悔应助ccm采纳,获得10
5秒前
5秒前
5秒前
cp1690发布了新的文献求助10
7秒前
英俊的铭应助苗条三问采纳,获得10
8秒前
8秒前
nolan完成签到 ,获得积分10
8秒前
9秒前
邪灬坤发布了新的文献求助10
9秒前
心想事成完成签到 ,获得积分10
9秒前
robert发布了新的文献求助10
10秒前
不是玉泉发布了新的文献求助20
10秒前
布布发布了新的文献求助10
11秒前
嘻嘻完成签到,获得积分10
12秒前
12秒前
蔡菜菜发布了新的文献求助10
12秒前
满天星发布了新的文献求助10
13秒前
sh131发布了新的文献求助10
13秒前
14秒前
烟花应助怕孤独的鸽子采纳,获得10
17秒前
zcaw完成签到,获得积分10
17秒前
旺仔同学完成签到,获得积分10
17秒前
丘比特应助布布采纳,获得10
18秒前
Hang完成签到,获得积分10
18秒前
robert完成签到,获得积分10
18秒前
西西发布了新的文献求助10
19秒前
19秒前
LL发布了新的文献求助10
20秒前
李健的小迷弟应助清蒸采纳,获得10
20秒前
sh131完成签到,获得积分10
20秒前
心心驳回了Hello应助
21秒前
沉静的不悔应助皇甫深旭采纳,获得10
22秒前
cp1690完成签到,获得积分10
24秒前
24秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to Helicopter and Tiltrotor Flight Simulation, Second Edition 2500
卤化钙钛矿人工突触的研究 2000
History of U.S. Space Surveillance and Satellite Cataloging 1000
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Materials selection in mechanical design 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6506434
求助须知:如何正确求助?哪些是违规求助? 8300216
关于积分的说明 17718420
捐赠科研通 5606839
什么是DOI,文献DOI怎么找? 2920772
邀请新用户注册赠送积分活动 1897902
关于科研通互助平台的介绍 1760301