Online Deep Reinforcement Learning for Computation Offloading in Blockchain-Empowered Mobile Edge Computing

强化学习 移动边缘计算 马尔可夫决策过程 计算机科学 杠杆(统计) 计算卸载 深度学习 边缘计算 云计算 分布式计算 GSM演进的增强数据速率 人工智能 机器学习 马尔可夫过程 操作系统 统计 数学
作者
Xiaoyu Qiu,Luobin Liu,Wuhui Chen,Zicong Hong,Zibin Zheng
出处
期刊:IEEE Transactions on Vehicular Technology [Institute of Electrical and Electronics Engineers]
卷期号:68 (8): 8050-8062 被引量:260
标识
DOI:10.1109/tvt.2019.2924015
摘要

Offloading computation-intensive tasks (e.g., blockchain consensus processes and data processing tasks) to the edge/cloud is a promising solution for blockchain-empowered mobile edge computing. However, the traditional offloading approaches (e.g., auction-based and game-theory approaches) fail to adjust the policy according to the changing environment and cannot achieve long-term performance. Moreover, the existing deep reinforcement learning-based offloading approaches suffer from the slow convergence caused by high-dimensional action space. In this paper, we propose a new model-free deep reinforcement learning-based online computation offloading approach for blockchain-empowered mobile edge computing in which both mining tasks and data processing tasks are considered. First, we formulate the online offloading problem as a Markov decision process by considering both the blockchain mining tasks and data processing tasks. Then, to maximize long-term offloading performance, we leverage deep reinforcement learning to accommodate highly dynamic environments and address the computational complexity. Furthermore, we introduce an adaptive genetic algorithm into the exploration of deep reinforcement learning to effectively avoid useless exploration and speed up the convergence without reducing performance. Finally, our experimental results demonstrate that our algorithm can converge quickly and outperform three benchmark policies.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
RR发布了新的文献求助10
刚刚
1秒前
2秒前
李爱国应助废物小点心采纳,获得10
2秒前
小皮艇完成签到 ,获得积分10
4秒前
Orange应助绅度采纳,获得10
4秒前
4秒前
5秒前
哒哒哒完成签到,获得积分10
5秒前
明月完成签到,获得积分10
6秒前
tough发布了新的文献求助10
7秒前
bluueboom发布了新的文献求助10
7秒前
开放凉面发布了新的文献求助10
7秒前
8秒前
沫栀发布了新的文献求助10
9秒前
当星际划破天空完成签到,获得积分10
10秒前
李二狗发布了新的文献求助10
10秒前
12秒前
天天快乐应助小贤采纳,获得10
12秒前
12秒前
13秒前
13秒前
14秒前
ajjyou完成签到,获得积分20
15秒前
Nolan完成签到,获得积分10
15秒前
15秒前
朱金雨发布了新的文献求助10
15秒前
一只柴完成签到,获得积分10
16秒前
Linda发布了新的文献求助10
18秒前
19秒前
雁枫完成签到,获得积分10
19秒前
20秒前
bluueboom完成签到,获得积分20
21秒前
21秒前
墨与笙完成签到,获得积分10
22秒前
zzyzzyz发布了新的文献求助10
23秒前
怳然发布了新的文献求助10
24秒前
斯文败类应助浮浮世世采纳,获得10
25秒前
Binbin完成签到,获得积分10
27秒前
花痴的手套完成签到 ,获得积分10
27秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Metallurgy at high pressures and high temperatures 2000
Various Faces of Animal Metaphor in English and Polish 800
An Introduction to Medicinal Chemistry 第六版习题答案 600
Cleopatra : A Reference Guide to Her Life and Works 500
Fundamentals of Strain Psychology 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6341506
求助须知:如何正确求助?哪些是违规求助? 8156814
关于积分的说明 17144651
捐赠科研通 5397735
什么是DOI,文献DOI怎么找? 2859349
邀请新用户注册赠送积分活动 1837285
关于科研通互助平台的介绍 1687273