The Application of Deep Reinforcement Learning to Distributed Spectrum Access in Dynamic Heterogeneous Environments With Partial Observations

计算机科学 稳健性(进化) 强化学习 人工智能 循环神经网络 频道(广播) 人工神经网络 机器学习 计算机网络 生物化学 基因 化学
作者
Yue Xu,Jianyuan Yu,R. Michael Buehrer
出处
期刊:IEEE Transactions on Wireless Communications [Institute of Electrical and Electronics Engineers]
卷期号:19 (7): 4494-4506 被引量:44
标识
DOI:10.1109/twc.2020.2984227
摘要

This papera 1 investigates deep reinforcement learning (DRL) based on a Recurrent Neural Network (RNN) for Dynamic Spectrum Access (DSA) under partial observations, referred to as a Deep Recurrent Q-Network (DRQN). Specifically, we consider a scenario with multiple independent channels and multiple heterogeneous Primary Users (PUs). Two key challenges in our problem formulation are that we assume our DRQN node does not have any prior knowledge of the other nodes' behavior patterns and attempts to predict the future channel state based on previous observations. The goal of the DRQN is to learn a channel access strategy with a low collision rate but a high channel utilization rate. With proper definitions of the state, action and rewards, our extensive simulation results show that a DRQN-based approach can handle a variety of communication environments including dynamic environments. Further, our results show that the DRQN node is also able to cope with multi-rate and multi-agent scenarios. Importantly, we show the following benefits of using recurrent neural networks in DSA: (i) the ability to learn the optimal strategy in different environments under partial observations; (ii) robustness to imperfect observations and (iii) the ability to utilize multiple channels, and (iv) robustness in the presence of multiple agents. 1 A parton of this work was presented at MILCOM 2018 in [1].
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
第七兵团司令完成签到,获得积分10
2秒前
2秒前
qwq应助追梦采纳,获得10
2秒前
2秒前
3秒前
我爱Chem完成签到 ,获得积分10
3秒前
半生发布了新的文献求助30
4秒前
4秒前
成就梦松完成签到,获得积分10
4秒前
byyyy完成签到,获得积分10
4秒前
温暖的俊驰完成签到,获得积分10
5秒前
Isabel完成签到,获得积分10
5秒前
yx应助陈强采纳,获得30
6秒前
sokach发布了新的文献求助10
8秒前
缓慢荔枝发布了新的文献求助10
8秒前
123发布了新的文献求助10
9秒前
天御雪完成签到,获得积分10
9秒前
gen关闭了gen文献求助
9秒前
9秒前
科研通AI5应助oldlee采纳,获得10
10秒前
10秒前
MADKAI发布了新的文献求助10
10秒前
哈哈悦完成签到,获得积分10
10秒前
赘婿应助duoduozs采纳,获得10
10秒前
kai完成签到,获得积分10
11秒前
11秒前
情怀应助xhy采纳,获得10
11秒前
整齐的灭绝完成签到 ,获得积分10
12秒前
充电宝应助船舵采纳,获得10
12秒前
lqphysics完成签到,获得积分10
12秒前
12秒前
小小完成签到 ,获得积分10
13秒前
320me666完成签到,获得积分10
14秒前
14秒前
velpro发布了新的文献求助10
15秒前
科研通AI5应助masu采纳,获得10
15秒前
小狸跟你拼啦完成签到,获得积分10
15秒前
寂寞的灵发布了新的文献求助10
15秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527304
求助须知:如何正确求助?哪些是违规求助? 3107454
关于积分的说明 9285518
捐赠科研通 2805269
什么是DOI,文献DOI怎么找? 1539827
邀请新用户注册赠送积分活动 716708
科研通“疑难数据库(出版商)”最低求助积分说明 709672