Performance and Cost-Efficient Spark Job Scheduling Based on Deep Reinforcement Learning in Cloud Computing Environments

计算机科学 强化学习 云计算 工作量 大数据 调度(生产过程) 软件部署 分布式计算 作业车间调度 SPARK(编程语言) 计算机集群 分析 人工智能 操作系统 数据科学 地铁列车时刻表 数学优化 程序设计语言 数学
作者
Muhammed Tawfiqul Islam,Shanika Karunasekera,Rajkumar Buyya
出处
期刊:IEEE Transactions on Parallel and Distributed Systems [Institute of Electrical and Electronics Engineers]
卷期号:33 (7): 1695-1710 被引量:55
标识
DOI:10.1109/tpds.2021.3124670
摘要

Big data frameworks such as Spark and Hadoop are widely adopted to run analytics jobs in both research and industry. Cloud offers affordable compute resources which are easier to manage. Hence, many organizations are shifting towards a cloud deployment of their big data computing clusters. However, job scheduling is a complex problem in the presence of various Service Level Agreement (SLA) objectives such as monetary cost reduction, and job performance improvement. Most of the existing research does not address multiple objectives together and fail to capture the inherent cluster and workload characteristics. In this article, we formulate the job scheduling problem of a cloud-deployed Spark cluster and propose a novel Reinforcement Learning (RL) model to accommodate the SLA objectives. We develop the RL cluster environment and implement two Deep Reinforce Learning (DRL) based schedulers in TF-Agents framework. The proposed DRL-based scheduling agents work at a fine-grained level to place the executors of jobs while leveraging the pricing model of cloud VM instances. In addition, the DRL-based agents can also learn the inherent characteristics of different types of jobs to find a proper placement to reduce both the total cluster VM usage cost and the average job duration. The results show that the proposed DRL-based algorithms can reduce the VM usage cost up to 30%.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
HHW完成签到,获得积分10
13秒前
Ray完成签到 ,获得积分10
22秒前
长孙烙完成签到 ,获得积分10
25秒前
32秒前
桂花酒酿慕斯完成签到,获得积分10
32秒前
二十六画生完成签到,获得积分10
33秒前
量子星尘发布了新的文献求助10
37秒前
二胡儿完成签到,获得积分10
37秒前
huanghe完成签到,获得积分10
40秒前
十一完成签到,获得积分10
43秒前
Eins完成签到 ,获得积分10
44秒前
打打应助科研通管家采纳,获得10
57秒前
上官若男应助科研通管家采纳,获得10
57秒前
勤奋的立果完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
张wx_100完成签到,获得积分10
1分钟前
结实山水完成签到 ,获得积分10
1分钟前
天天开心完成签到 ,获得积分10
1分钟前
1分钟前
谷雨完成签到 ,获得积分10
1分钟前
苗笑卉发布了新的文献求助10
1分钟前
fishss完成签到 ,获得积分0
1分钟前
ccmxigua完成签到,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
纯真保温杯完成签到 ,获得积分10
2分钟前
BowieHuang应助苗笑卉采纳,获得10
2分钟前
小谭完成签到 ,获得积分10
2分钟前
Orange应助tcheng采纳,获得10
2分钟前
苗笑卉完成签到,获得积分10
2分钟前
量子星尘发布了新的文献求助10
2分钟前
Xzx1995完成签到 ,获得积分10
2分钟前
风雨霖霖完成签到 ,获得积分10
2分钟前
2分钟前
tcheng发布了新的文献求助10
2分钟前
lht完成签到 ,获得积分10
2分钟前
black_cavalry完成签到,获得积分10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
shhoing应助科研通管家采纳,获得10
2分钟前
阳光醉山完成签到 ,获得积分10
3分钟前
笨笨完成签到 ,获得积分10
3分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
List of 1,091 Public Pension Profiles by Region 1581
以液相層析串聯質譜法分析糖漿產品中活性雙羰基化合物 / 吳瑋元[撰] = Analysis of reactive dicarbonyl species in syrup products by LC-MS/MS / Wei-Yuan Wu 1000
Biology of the Reptilia. Volume 21. Morphology I. The Skull and Appendicular Locomotor Apparatus of Lepidosauria 600
The Scope of Slavic Aspect 600
Foregrounding Marking Shift in Sundanese Written Narrative Segments 600
Rousseau, le chemin de ronde 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5539114
求助须知:如何正确求助?哪些是违规求助? 4625935
关于积分的说明 14597077
捐赠科研通 4566744
什么是DOI,文献DOI怎么找? 2503536
邀请新用户注册赠送积分活动 1481524
关于科研通互助平台的介绍 1453020