已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Improving anti-jamming decision-making strategies for cognitive radar via multi-agent deep reinforcement learning

强化学习 马尔可夫决策过程 计算机科学 干扰 人工智能 雷达 部分可观测马尔可夫决策过程 电子战 机器学习 过程(计算) 决策支持系统 运筹学 马尔可夫过程 马尔可夫链 马尔可夫模型 工程类 电信 物理 热力学 统计 数学 操作系统
作者
Wen Jiang,Yihui Ren,Yanping Wang
出处
期刊:Digital Signal Processing [Elsevier]
卷期号:135: 103952-103952 被引量:3
标识
DOI:10.1016/j.dsp.2023.103952
摘要

Most of the existing anti-jamming decision-making methods overly rely on the subjective experience of radar operators. However, due to the rapid development of cognitive radar and modern electronic warfare, conventional anti-jamming decision-making methods can no longer adapt to the complex and changing electromagnetic environment. The advent of deep reinforcement learning (DRL) provides a new attractive solution for this issue. In this paper, an adversarial anti-jamming decision-making network for cognitive radar via multi-agent deep reinforcement learning (MDRL) is proposed, which has good self-learning ability and can meet the requirements of intelligent, dynamic and real-time in modern electronic warfare. Since competitive decision-makers are considered and these two confrontational sides are not able to obtain the completely accurate information of each other, the environment model is specifically constructed as a partially observable Markov decision process (POMDP). Then, a decision-making network is designed based on deterministic deep deterministic policy gradient (DDPG) algorithm to explore the competition between cognitive radar and smart jammer. In order to overcome the environment non-stationarity, the decision-making network is trained and tested in a special MDRL framework. The experimental results demonstrate that the proposed method is effective in anti-jamming decision-making system of cognitive radar. Furthermore, the two confrontational sides show high decision-making ability and perform well in the adversarial scenario by comparing with other training policies, which demonstrate that confrontational training with powerful opponents can improve the intelligence level of all agents.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
懵懂的毛豆应助熊一只采纳,获得10
刚刚
3秒前
泥娃娃完成签到,获得积分10
6秒前
6秒前
深情安青应助Billy采纳,获得10
7秒前
可爱的大白菜真实的钥匙完成签到 ,获得积分10
10秒前
shanshan123458完成签到 ,获得积分10
11秒前
优雅的橘子完成签到,获得积分10
11秒前
tuanvybaby发布了新的文献求助10
11秒前
13秒前
土豆你个西红柿完成签到 ,获得积分10
15秒前
xy关注了科研通微信公众号
15秒前
18秒前
水若冰寒发布了新的文献求助10
19秒前
20秒前
L_MD完成签到,获得积分10
20秒前
Billy发布了新的文献求助10
21秒前
耶椰耶完成签到 ,获得积分10
21秒前
占稚晴完成签到 ,获得积分10
21秒前
22秒前
tomorrow完成签到,获得积分10
23秒前
26秒前
fdwang完成签到 ,获得积分10
27秒前
duts完成签到 ,获得积分10
31秒前
31秒前
xy发布了新的文献求助10
32秒前
36秒前
Owen应助爱科研的小导航采纳,获得10
36秒前
37秒前
zxm发布了新的文献求助10
39秒前
orixero应助风筝与亭采纳,获得20
39秒前
想游泳的鹰完成签到,获得积分10
42秒前
WHG发布了新的文献求助10
44秒前
44秒前
野性的人达完成签到 ,获得积分10
45秒前
zxm完成签到,获得积分20
45秒前
ZhJF完成签到 ,获得积分10
50秒前
monicaj完成签到 ,获得积分10
53秒前
Sheldon完成签到,获得积分10
54秒前
54秒前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Effect of reactor temperature on FCC yield 2000
Very-high-order BVD Schemes Using β-variable THINC Method 1020
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
Mission to Mao: Us Intelligence and the Chinese Communists in World War II 600
The Conscience of the Party: Hu Yaobang, China’s Communist Reformer 600
MATLAB在传热学例题中的应用 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3303128
求助须知:如何正确求助?哪些是违规求助? 2937418
关于积分的说明 8481942
捐赠科研通 2611331
什么是DOI,文献DOI怎么找? 1425790
科研通“疑难数据库(出版商)”最低求助积分说明 662434
邀请新用户注册赠送积分活动 646911