Performance and Cost-Efficient Spark Job Scheduling Based on Deep Reinforcement Learning in Cloud Computing Environments

计算机科学 强化学习 云计算 工作量 大数据 调度(生产过程) 软件部署 分布式计算 作业车间调度 SPARK(编程语言) 计算机集群 分析 人工智能 操作系统 数据科学 地铁列车时刻表 数学优化 程序设计语言 数学
作者
Muhammed Tawfiqul Islam,Shanika Karunasekera,Rajkumar Buyya
出处
期刊:IEEE Transactions on Parallel and Distributed Systems [Institute of Electrical and Electronics Engineers]
卷期号:33 (7): 1695-1710 被引量:55
标识
DOI:10.1109/tpds.2021.3124670
摘要

Big data frameworks such as Spark and Hadoop are widely adopted to run analytics jobs in both research and industry. Cloud offers affordable compute resources which are easier to manage. Hence, many organizations are shifting towards a cloud deployment of their big data computing clusters. However, job scheduling is a complex problem in the presence of various Service Level Agreement (SLA) objectives such as monetary cost reduction, and job performance improvement. Most of the existing research does not address multiple objectives together and fail to capture the inherent cluster and workload characteristics. In this article, we formulate the job scheduling problem of a cloud-deployed Spark cluster and propose a novel Reinforcement Learning (RL) model to accommodate the SLA objectives. We develop the RL cluster environment and implement two Deep Reinforce Learning (DRL) based schedulers in TF-Agents framework. The proposed DRL-based scheduling agents work at a fine-grained level to place the executors of jobs while leveraging the pricing model of cloud VM instances. In addition, the DRL-based agents can also learn the inherent characteristics of different types of jobs to find a proper placement to reduce both the total cluster VM usage cost and the average job duration. The results show that the proposed DRL-based algorithms can reduce the VM usage cost up to 30%.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
那咋办嘛完成签到 ,获得积分10
2秒前
吴晓峰完成签到,获得积分10
2秒前
starry南鸢完成签到 ,获得积分10
2秒前
清水完成签到 ,获得积分10
2秒前
6秒前
在水一方应助shan采纳,获得10
7秒前
哥哥完成签到 ,获得积分10
7秒前
她的城完成签到,获得积分0
8秒前
吴晓峰发布了新的文献求助10
9秒前
jin发布了新的文献求助10
10秒前
魔术师完成签到 ,获得积分10
12秒前
完美世界应助科研通管家采纳,获得10
12秒前
Ava应助科研通管家采纳,获得10
12秒前
求助应助科研通管家采纳,获得10
12秒前
求助应助科研通管家采纳,获得10
12秒前
求助应助科研通管家采纳,获得10
12秒前
雨柏完成签到 ,获得积分10
13秒前
一叶知秋完成签到,获得积分10
14秒前
忧郁如柏完成签到,获得积分10
15秒前
小g完成签到 ,获得积分10
15秒前
bkagyin应助jake采纳,获得10
19秒前
久晓完成签到 ,获得积分10
22秒前
香蕉觅云应助健壮惋清采纳,获得10
24秒前
月夕完成签到 ,获得积分10
25秒前
思源应助PIngguo采纳,获得10
32秒前
分析完成签到 ,获得积分10
33秒前
哼哼啊嗯哼啊完成签到 ,获得积分10
34秒前
Liumingyu完成签到,获得积分10
40秒前
kexing完成签到 ,获得积分10
44秒前
听寒完成签到,获得积分10
48秒前
牧小妮完成签到,获得积分10
56秒前
Liumingyu发布了新的文献求助10
57秒前
传奇3应助shan采纳,获得10
1分钟前
Ferry完成签到 ,获得积分10
1分钟前
光头大叔完成签到 ,获得积分10
1分钟前
1分钟前
韦韦完成签到 ,获得积分10
1分钟前
我要读博士完成签到 ,获得积分10
1分钟前
小AB发布了新的文献求助10
1分钟前
聪慧的石头完成签到,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Handbook of pharmaceutical excipients, Ninth edition 5000
Digital Twins of Advanced Materials Processing 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
Polymorphism and polytypism in crystals 1000
Social Cognition: Understanding People and Events 800
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6028429
求助须知:如何正确求助?哪些是违规求助? 7690535
关于积分的说明 16186531
捐赠科研通 5175597
什么是DOI,文献DOI怎么找? 2769599
邀请新用户注册赠送积分活动 1753051
关于科研通互助平台的介绍 1638822