PipeCompress: Accelerating Pipelined Communication for Distributed Deep Learning

计算机科学 可扩展性 瓶颈 过程(计算) 数据压缩 分布式计算 管道(软件) 反向传播 深度学习 实时计算 通信系统 人工智能 人工神经网络 嵌入式系统 计算机网络 数据库 操作系统 程序设计语言
作者
Juncai Liu,Jessie Hui Wang,Chenghao Rong,Jilong Wang
标识
DOI:10.1109/icc45855.2022.9839126
摘要

Distributed learning is widely used to accelerate the training of deep learning models, but it is known that communication efficiency limits the scalability of distributed learning systems. Current gradient compression techniques provide promising methods to reduce communication time, but the extra time incurred by compression is not negligible. After compression techniques are applied, the communication time is significantly reduced because the data size needed to communicate becomes much smaller, but compressing gradients is time-consuming and it becomes a new bottleneck. In this paper, we design and implement PipeCompress, a system to decouple compression and backpropagation operations into two processes and pipeline the two processes to hide compression time. We also propose a specialized inter-process communication mechanism based on the characteristics of DNN distributed training to improve the efficiency of passing messages between the two processes, which makes sure that the decoupling does not bring much extra inter-process communication time cost. As far as we know, this is the first work that notices the overhead of compression and pipelines backpropagation and compression operations to hide compression time in distributed learning. Experiments show that PipeCompress can significantly hide compression time, reduce iteration time, and accelerate the training process on various DNN models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
徐不想搞科研关注了科研通微信公众号
刚刚
爱学习的小花生完成签到,获得积分10
1秒前
1秒前
传奇3应助娜娜采纳,获得10
2秒前
tianzml0应助66666采纳,获得10
2秒前
小九的呀完成签到 ,获得积分10
2秒前
爆米花应助Hh采纳,获得10
3秒前
小小乖发布了新的文献求助10
4秒前
英俊的念寒完成签到,获得积分10
4秒前
shirley完成签到,获得积分10
5秒前
wrr完成签到,获得积分10
5秒前
6秒前
机智的友容完成签到 ,获得积分10
6秒前
6秒前
润清发布了新的文献求助10
7秒前
玩儿发布了新的文献求助10
7秒前
落瑾玘完成签到,获得积分10
7秒前
科研通AI2S应助风中的玲采纳,获得10
8秒前
9秒前
耍酷的傲白应助安徒采纳,获得10
10秒前
11秒前
温梦花雨完成签到 ,获得积分10
12秒前
hugdoggy完成签到,获得积分10
13秒前
涨芝士完成签到 ,获得积分10
13秒前
有魅力哈密瓜完成签到,获得积分10
14秒前
娜娜完成签到,获得积分10
14秒前
16秒前
17秒前
17秒前
咪呀完成签到,获得积分10
18秒前
19秒前
FashionBoy应助爱笑的雪糕采纳,获得10
19秒前
CCC完成签到,获得积分10
19秒前
20秒前
专一的身影完成签到 ,获得积分10
20秒前
牛人发布了新的文献求助10
21秒前
22秒前
一与余完成签到,获得积分10
23秒前
南亭完成签到,获得积分10
23秒前
pengmin111abg发布了新的文献求助10
24秒前
高分求助中
Evolution 10000
ISSN 2159-8274 EISSN 2159-8290 1000
Becoming: An Introduction to Jung's Concept of Individuation 600
Ore genesis in the Zambian Copperbelt with particular reference to the northern sector of the Chambishi basin 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3162790
求助须知:如何正确求助?哪些是违规求助? 2813724
关于积分的说明 7901861
捐赠科研通 2473365
什么是DOI,文献DOI怎么找? 1316788
科研通“疑难数据库(出版商)”最低求助积分说明 631520
版权声明 602175