DNN Real-Time Collaborative Inference Acceleration with Mobile Edge Computing

计算机科学 推论 延迟(音频) 分布式计算 分拆(数论) GSM演进的增强数据速率 边缘设备 云计算 移动设备 背景(考古学) 近似推理 人工智能 电信 古生物学 数学 组合数学 生物 操作系统
作者
Run Yang,Yan Li,Hui He,Weizhe Zhang
标识
DOI:10.1109/ijcnn55064.2022.9892582
摘要

The collaborative inference approach splits the Deep Neural Networks (DNNs) model into two parts. It runs collaboratively on the end device and cloud server to minimize inference latency and protect data privacy, especially in the 5G era. The scheme of DNN model partitioning depends on the network bandwidth size. However, in the context of dynamic mobile networks, resource-constrained devices cannot efficiently execute complex model partitioning algorithms to obtain optimal partitioning in real-time. In this paper, to overcome this challenge, we first formulate the model partitioning problem as a Min-cut problem to seek the optimal partition. Second, we propose a Collaborative Inference method based on model Compression named CIC. CIC enhances the efficiency of the execution of model partitioning algorithms on resource-constrained end devices by reducing the algorithm's complexity. CIC generates a splitting model based on the inherent characteristics of the DNN model and the platform resources. The splitting models are independent of the network environment, generated offline, and constantly used in the current environment. CIC has excellent compressibility, and even DNN models with hundreds of layers can be rapidly partitioned on resource-constrained devices. Experimental results show that our method is significantly more effective than existing solutions, speeding up model partitioning decision time by up to 100x, reducing inference latency by up to 2.6x, and increasing throughput by up to 3.3x in the best case.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
英勇代荷完成签到,获得积分20
2秒前
3秒前
科研小白人完成签到 ,获得积分10
4秒前
5秒前
清爽冬莲完成签到 ,获得积分10
5秒前
5秒前
6秒前
7秒前
7秒前
干雅柏完成签到,获得积分10
7秒前
7秒前
orixero应助忐忑的邑采纳,获得10
8秒前
9秒前
HEIKU应助细心怜寒采纳,获得10
9秒前
欢呼的以蓝完成签到,获得积分10
9秒前
9秒前
Nirejer发布了新的文献求助10
10秒前
雷大帅发布了新的文献求助10
10秒前
强强科研完成签到,获得积分10
11秒前
干雅柏发布了新的文献求助10
11秒前
魔幻傲晴完成签到 ,获得积分10
11秒前
吨吨完成签到,获得积分10
11秒前
11秒前
12秒前
12秒前
Funeral完成签到,获得积分10
12秒前
朴素的海莲完成签到,获得积分20
12秒前
小蘑菇应助669936lyh采纳,获得10
13秒前
13秒前
在水一方应助儒雅沛蓝采纳,获得10
13秒前
有人应助缥缈的涵菡采纳,获得10
14秒前
rortis应助季心安采纳,获得10
15秒前
feng完成签到 ,获得积分10
17秒前
小冯发布了新的文献求助10
17秒前
张益萌应助想毕业的马涛采纳,获得80
17秒前
Jasper应助神内小大夫采纳,获得10
17秒前
18秒前
长京完成签到 ,获得积分10
20秒前
高分求助中
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger Heßler, Claudia, Rud 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
Natural History of Mantodea 螳螂的自然史 1000
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
Barge Mooring (Oilfield Seamanship Series Volume 6) 600
Spatial Political Economy: Uneven Development and the Production of Nature in Chile 400
山海经图录 李云中版 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3327904
求助须知:如何正确求助?哪些是违规求助? 2958065
关于积分的说明 8589051
捐赠科研通 2636332
什么是DOI,文献DOI怎么找? 1442923
科研通“疑难数据库(出版商)”最低求助积分说明 668438
邀请新用户注册赠送积分活动 655568