亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

A method of network attack-defense game and collaborative defense decision-making based on hierarchical multi-agent reinforcement learning

强化学习 计算机科学 活力 斯塔克伯格竞赛 构造(python库) 计算机安全 人工智能 物理 数学 数理经济学 量子力学 程序设计语言
作者
Yunlong Tang,Jing Sun,Huan Wang,Junyi Deng,Tong Liang,Wenhong Xu
出处
期刊:Computers & Security [Elsevier]
卷期号:142: 103871-103871 被引量:2
标识
DOI:10.1016/j.cose.2024.103871
摘要

Faced with the challenges of security strategy design brought about by the complexity of attack behavior and the dynamism of network structure, dynamic hierarchical intelligent defense methods have shown their effectiveness. However, in complex network environments, their application requires a higher level of coordination mechanisms. Therefore, this paper proposes a hierarchical multi-agent reinforcement learning network attack and defense game and cooperative defense decision-making method, which autonomously and efficiently completes the formulation of defense strategies and defense behavior responses. Firstly, we construct a Stackelberg hypergame model of cyberspace conflicts, and under the condition of information loss, characterize the multi-layer dynamic defense coordination response mechanism. Secondly, By utilizing a hierarchical multi-agent reinforcement learning method as the driving force for game evolution, we sequentially solve the Nash equilibrium of the game, and form a dynamic autonomous defense strategy. Finally, we construct a hierarchical multi-agent reinforcement learning framework, which decouples the defense decision problem, reduces the dimension of the defense action space and the exploration difficulty of the strategy space, and learns coordinated defense strategies more efficiently. We used the CybORG (Cyber Operations Research Gym) environment for simulation. We compared and analyzed the autonomously generated cyber defense strategies with other related works, verifying the superior coordination performance of our method in defense strategy generation and control.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
月墨雪发布了新的文献求助10
刚刚
浮云完成签到,获得积分10
1秒前
小脚丫完成签到 ,获得积分10
29秒前
烟花应助繁荣的土豆采纳,获得10
29秒前
tarako发布了新的文献求助30
33秒前
子平完成签到 ,获得积分10
33秒前
40秒前
52秒前
55秒前
Lucas应助爱听歌笑寒采纳,获得10
58秒前
58秒前
jyy发布了新的文献求助10
59秒前
1分钟前
1分钟前
ldysaber完成签到,获得积分0
1分钟前
1分钟前
繁荣的土豆完成签到,获得积分20
1分钟前
2分钟前
劳健龙完成签到 ,获得积分10
2分钟前
2分钟前
3分钟前
3分钟前
十七应助cxy采纳,获得10
3分钟前
CodeCraft应助爱听歌笑寒采纳,获得10
4分钟前
4分钟前
4分钟前
NexusExplorer应助xx采纳,获得10
4分钟前
4分钟前
4分钟前
4分钟前
xx发布了新的文献求助10
4分钟前
tarako发布了新的文献求助10
5分钟前
科研通AI2S应助tarako采纳,获得10
5分钟前
5分钟前
Peri发布了新的文献求助10
5分钟前
5分钟前
ZXD1989完成签到 ,获得积分10
5分钟前
李剑鸿发布了新的文献求助200
5分钟前
乖拉发布了新的文献求助20
6分钟前
zsmj23完成签到 ,获得积分0
6分钟前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1500
Les Mantodea de Guyane 1000
Very-high-order BVD Schemes Using β-variable THINC Method 970
Field Guide to Insects of South Africa 660
Foucault's Technologies Another Way of Cutting Reality 500
Forensic Chemistry 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3393035
求助须知:如何正确求助?哪些是违规求助? 3003391
关于积分的说明 8809133
捐赠科研通 2690184
什么是DOI,文献DOI怎么找? 1473496
科研通“疑难数据库(出版商)”最低求助积分说明 681603
邀请新用户注册赠送积分活动 674534