Joint Optimization of Caching, Computing, and Radio Resources for Fog-Enabled IoT Using Natural Actor–Critic Deep Reinforcement Learning

计算机科学 强化学习 回程(电信) 马尔可夫决策过程 分布式计算 无线接入网 无线网络 最优化问题 计算卸载 云计算 计算机网络 Lyapunov优化 无线 边缘计算 人工智能 马尔可夫过程 基站 电信 统计 Lyapunov重新设计 操作系统 数学 李雅普诺夫指数 移动台 混乱的 算法
作者
Yifei Wei,F. Richard Yu,Mei Song,Zhu Han
出处
期刊:IEEE Internet of Things Journal [Institute of Electrical and Electronics Engineers]
卷期号:6 (2): 2061-2073 被引量:276
标识
DOI:10.1109/jiot.2018.2878435
摘要

The cloud-based Internet of Things (IoT) develops rapidly but suffer from large latency and backhaul bandwidth requirement, the technology of fog computing and caching has emerged as a promising paradigm for IoT to provide proximity services, and thus reduce service latency and save backhaul bandwidth. However, the performance of the fog-enabled IoT depends on the intelligent and efficient management of various network resources, and consequently the synergy of caching, computing, and communications becomes the big challenge. This paper simultaneously tackles the issues of content caching strategy, computation offloading policy, and radio resource allocation, and propose a joint optimization solution for the fog-enabled IoT. Since wireless signals and service requests have stochastic properties, we use the actor-critic reinforcement learning framework to solve the joint decision-making problem with the objective of minimizing the average end-to-end delay. The deep neural network (DNN) is employed as the function approximator to estimate the value functions in the critic part due to the extremely large state and action space in our problem. The actor part uses another DNN to represent a parameterized stochastic policy and improves the policy with the help of the critic. Furthermore, the Natural policy gradient method is used to avoid converging to the local maximum. Using the numerical simulations, we demonstrate the learning capacity of the proposed algorithm and analyze the end-to-end service latency.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
传奇3应助起司嗯采纳,获得10
刚刚
remimazolam发布了新的文献求助10
1秒前
在水一方应助悦耳寒松采纳,获得10
1秒前
满座完成签到,获得积分10
1秒前
科研通AI2S应助coffee采纳,获得10
1秒前
2秒前
雪山飞龙发布了新的文献求助30
2秒前
科研通AI5应助phd采纳,获得10
3秒前
善学以致用应助京阿尼采纳,获得10
3秒前
Sylvia完成签到,获得积分10
3秒前
朴素的鸡发布了新的文献求助10
3秒前
SCI发布了新的文献求助10
3秒前
凹凸曼打小傻蛋完成签到 ,获得积分10
4秒前
Enoch完成签到,获得积分10
4秒前
Sara完成签到,获得积分10
4秒前
4秒前
zhuzhu发布了新的文献求助20
4秒前
YUZU发布了新的文献求助10
5秒前
5秒前
6秒前
shirleeyeahe完成签到,获得积分10
7秒前
7秒前
特特雷珀萨努完成签到 ,获得积分10
7秒前
京阿尼完成签到,获得积分10
7秒前
风雨发布了新的文献求助10
7秒前
orixero应助今非采纳,获得10
7秒前
平常的G完成签到,获得积分10
8秒前
8秒前
小石头完成签到,获得积分10
9秒前
9秒前
YL完成签到 ,获得积分10
9秒前
9秒前
上官若男应助整齐路灯采纳,获得10
9秒前
yyj发布了新的文献求助10
9秒前
细腻的麦片完成签到,获得积分20
10秒前
10秒前
君君完成签到,获得积分10
11秒前
cchen0902完成签到,获得积分10
11秒前
Sara发布了新的文献求助10
11秒前
11秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527849
求助须知:如何正确求助?哪些是违规求助? 3107938
关于积分的说明 9287239
捐赠科研通 2805706
什么是DOI,文献DOI怎么找? 1540033
邀请新用户注册赠送积分活动 716893
科研通“疑难数据库(出版商)”最低求助积分说明 709794