亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

GPARS: Graph predictive algorithm for efficient resource scheduling in heterogeneous GPU clusters

计算机科学 调度(生产过程) 图形处理单元 GPU群集 对称多处理机系统 图形 图形处理单元的通用计算 分布式计算 库达 算法 并行计算 绘图 理论计算机科学 数学优化 操作系统 数学
作者
Sheng Wang,Shiping Chen,Yumei Shi
出处
期刊:Future Generation Computer Systems [Elsevier BV]
卷期号:152: 127-137 被引量:1
标识
DOI:10.1016/j.future.2023.10.022
摘要

Efficient resource scheduling in heterogeneous graphics processing unit (GPU) clusters are critical for maximizing system performance and optimizing resource utilization. However, prior research in resource scheduling algorithms typically employed machine learning (ML) algorithms to estimate job durations or GPU utilization in the cluster based on training progress and task speed. Regrettably, these studies often overlooked the performance variations among different GPU types within these clusters, as well as the presence of spatiotemporal correlations among jobs. To address these limitations, this paper introduces the graph predictive algorithm for efficient resource scheduling (GPARS) designed specifically for heterogeneous clusters. GPARS leverages spatiotemporal correlations among jobs and utilizes graph attention networks (GANs) for precise job duration prediction. Building upon the prediction results, we develop a dynamic objective function to allocate suitable GPU types for newly submitted jobs. By conducting a comprehensive analysis of Alibaba's heterogeneous GPU cluster, we delve into the impact of GPU capacity and type on job completion time (JCT) and resource utilization. Our evaluation, using real traces from Alibaba and Philly, substantiates the effectiveness of GPARS. It achieves a remarkable 10.29% reduction in waiting time and an average improvement of 7.47% in resource utilization compared to the original scheduling method. These findings underscore GPARS's superior performance in enhancing resource scheduling within heterogeneous GPU clusters.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
yipmyonphu完成签到,获得积分10
12秒前
小蘑菇应助长余常开心采纳,获得10
24秒前
29秒前
32秒前
55秒前
1分钟前
长余常开心完成签到,获得积分10
1分钟前
脑洞疼应助科研通管家采纳,获得10
1分钟前
wanci应助科研通管家采纳,获得10
1分钟前
XiaoLiu完成签到,获得积分10
1分钟前
老老实实好好活着完成签到,获得积分10
2分钟前
gao0505完成签到,获得积分10
2分钟前
TXZ06完成签到,获得积分10
2分钟前
Dzinver发布了新的文献求助10
3分钟前
3分钟前
3分钟前
movoandy发布了新的文献求助10
3分钟前
科研通AI2S应助Jie采纳,获得10
3分钟前
传奇3应助movoandy采纳,获得10
3分钟前
毛毛完成签到,获得积分0
4分钟前
4分钟前
bucai完成签到 ,获得积分10
4分钟前
bkagyin应助Dzinver采纳,获得10
4分钟前
5分钟前
Dzinver发布了新的文献求助10
5分钟前
科研通AI2S应助科研通管家采纳,获得10
5分钟前
鸟兽兽应助科研通管家采纳,获得10
5分钟前
Atopos驳回了田様应助
5分钟前
Jack祺完成签到 ,获得积分10
5分钟前
5分钟前
5分钟前
6分钟前
Atopos发布了新的文献求助10
6分钟前
好奇好奇的猫完成签到,获得积分20
6分钟前
6分钟前
一点点粽子完成签到,获得积分10
6分钟前
6分钟前
NS完成签到,获得积分10
6分钟前
7分钟前
Yan完成签到,获得积分10
7分钟前
高分求助中
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
Signals, Systems, and Signal Processing 610
GMP in Practice: Regulatory Expectations for the Pharmaceutical Industry 500
领导干部角色心理研究 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6284108
求助须知:如何正确求助?哪些是违规求助? 8102827
关于积分的说明 16942595
捐赠科研通 5350459
什么是DOI,文献DOI怎么找? 2843768
邀请新用户注册赠送积分活动 1820864
关于科研通互助平台的介绍 1677695