Versa-DNN: A Versatile Architecture Enabling High-Performance and Energy-Efficient Multi-DNN Acceleration

计算机科学 调度(生产过程) 高效能源利用 计算 加速 分布式计算 计算机体系结构 并行计算 吞吐量 嵌入式系统 电气工程 无线 经济 工程类 电信 运营管理 算法
作者
Jiaqi Yang,Hao Zheng,Ahmed Louri
出处
期刊:IEEE Transactions on Parallel and Distributed Systems [Institute of Electrical and Electronics Engineers]
卷期号:35 (2): 349-361 被引量:3
标识
DOI:10.1109/tpds.2023.3340953
摘要

Emerging applications utilize numerous Deep Neural Networks (DNNs) to address multiple tasks simultaneously. As these applications continue to expand, there is a growing need for off-chip memory access optimization and innovative architectures that can adapt to diverse computation, memory, and communication requirements of various DNN models. To address these challenges, we propose Versa-DNN, a versatile DNN accelerator that can provide efficient computation, memory, and communication support for the simultaneous execution of multiple DNNs. Versa-DNN features three unique designs: a flexible off-chip memory access optimization strategy, adaptable communication fabrics, and a communication and computational aware scheduling algorithm. The proposed off-chip memory optimization strategy can improve performance and energy efficiency by increasing hardware utilization, eliminating excess data duplication, and reducing off-chip memory accesses. The adaptable communication fabrics consist of distributed buffers, processing elements, and a flexible Network-on-Chip (NoC), which can dynamically morph and fission to support distinct communication and computation needs for simultaneously running DNN models. Furthermore, the proposed scheduling policy manages the simultaneous execution of multiple DNN models with improved performance and energy efficiency. Simulation results using several DNN models, show that the proposed Versa-DNN architecture achieves 41%, 238%, 392% throughput speedup and 30%, 59%, 63% energy reduction on average for different workloads when compared to state-of-the-art accelerators such as Planaria, Herald, and AI-MT, respectively.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
风中琦完成签到 ,获得积分10
5秒前
宛宛完成签到 ,获得积分10
7秒前
su完成签到 ,获得积分10
10秒前
星辰大海应助JACK采纳,获得10
10秒前
10秒前
陈皮完成签到 ,获得积分10
12秒前
jun完成签到 ,获得积分10
14秒前
jjj完成签到 ,获得积分10
14秒前
lamer完成签到,获得积分10
25秒前
caroline完成签到 ,获得积分10
25秒前
酷酷皮卡丘完成签到 ,获得积分10
28秒前
小田完成签到 ,获得积分10
30秒前
31秒前
悄悄完成签到 ,获得积分10
35秒前
榆木小鸟完成签到 ,获得积分10
37秒前
terryok完成签到 ,获得积分10
37秒前
小墨墨完成签到 ,获得积分10
38秒前
kanong完成签到,获得积分0
38秒前
冰留完成签到 ,获得积分10
40秒前
畅快的念烟完成签到,获得积分10
41秒前
善善完成签到 ,获得积分10
43秒前
43秒前
MRJJJJ完成签到,获得积分10
45秒前
研友_8D3KzZ发布了新的文献求助10
49秒前
自觉石头完成签到 ,获得积分10
51秒前
舒心的青亦完成签到 ,获得积分10
52秒前
小学生学免疫完成签到 ,获得积分10
52秒前
53秒前
SCINEXUS完成签到,获得积分0
56秒前
56秒前
a1313发布了新的文献求助10
58秒前
打打应助研友_8D3KzZ采纳,获得10
58秒前
纯情的远山完成签到,获得积分10
59秒前
1分钟前
1分钟前
1分钟前
小羊咩完成签到 ,获得积分10
1分钟前
文献搬运工完成签到 ,获得积分10
1分钟前
自觉语琴完成签到 ,获得积分10
1分钟前
个性惜蕊完成签到,获得积分10
1分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Musculoskeletal Pain - Market Insight, Epidemiology And Market Forecast - 2034 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Munson, Young, and Okiishi’s Fundamentals of Fluid Mechanics 9 edition problem solution manual (metric) 800
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3749979
求助须知:如何正确求助?哪些是违规求助? 3293254
关于积分的说明 10080192
捐赠科研通 3008614
什么是DOI,文献DOI怎么找? 1652307
邀请新用户注册赠送积分活动 787350
科研通“疑难数据库(出版商)”最低求助积分说明 752096