GNA: Reconfigurable and Efficient Architecture for Generative Network Acceleration

计算机科学 残余物 人工神经网络 计算机工程 计算 卷积神经网络 调度(生产过程) 控制重构 并行计算 算法 人工智能 嵌入式系统 运营管理 经济
作者
Jiale Yan,Shouyi Yin,Fengbin Tu,Leibo Liu,Shaojun Wei
出处
期刊:IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems [Institute of Electrical and Electronics Engineers]
卷期号:37 (11): 2519-2529 被引量:47
标识
DOI:10.1109/tcad.2018.2857258
摘要

Generative networks have become ubiquitous in image generation applications like image super-resolution, image to image translation, and text to image synthesis. They are usually composed of convolutional (CONV) layers, convolution-based residual blocks, and deconvolutional (DeCONV) layers. Previous works on neural network acceleration focus too much on optimizing CONV layers computation such as data-reuse or parallel computation, but have low processing element (PE) utilization in computing residual blocks and DeCONV layers: residual blocks require very high memory bandwidth when performing elementwise additions on residual paths; DeCONV layers have imbalanced operation counts for different outputs. In this paper, we propose a dual convolution mapping method for CONV and DeCONV layers to make full use of the available PE resources. A cross-layer scheduling method is also proposed to avoid extra off-chip memory access in residual block processing. Precision-adaptive PEs and buffer bandwidth reconfiguration are used to support flexible bitwidths for both inputs and weights in deep neural networks. We implement a generative network accelerator (GNA) based on intra-PE processing, inter-PE processing, and cross-layer scheduling techniques. Owing to the proposed optimization techniques, GNA achieves energy efficiency of 2.05 TOPS/W with 61% higher PE utilization than traditional methods in generative network acceleration.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
白白完成签到,获得积分10
刚刚
骆驼牛子完成签到,获得积分10
刚刚
怡然凌柏完成签到 ,获得积分10
刚刚
刚刚
要减肥的牛马完成签到,获得积分10
刚刚
RR发布了新的文献求助10
1秒前
qiufen关注了科研通微信公众号
1秒前
LEO完成签到,获得积分10
2秒前
Yy完成签到,获得积分10
2秒前
2秒前
畅快的小懒虫完成签到,获得积分10
3秒前
尊敬的芷卉完成签到,获得积分10
3秒前
xxx完成签到 ,获得积分10
4秒前
nn发布了新的文献求助10
4秒前
FrankW发布了新的文献求助10
4秒前
4秒前
4秒前
从容灵松完成签到 ,获得积分10
5秒前
5秒前
5秒前
5秒前
rita完成签到,获得积分10
6秒前
深情安青应助感动的刚采纳,获得10
6秒前
完美世界应助科研小辣鸡采纳,获得10
6秒前
Liu完成签到 ,获得积分10
7秒前
丫丫完成签到 ,获得积分10
7秒前
CyrusSo524发布了新的文献求助200
7秒前
褚晣完成签到,获得积分10
7秒前
潇洒板栗发布了新的文献求助10
8秒前
yanziwu94完成签到,获得积分10
8秒前
8秒前
9秒前
10秒前
椿上春树完成签到,获得积分10
10秒前
xinxin发布了新的文献求助10
10秒前
cjw完成签到 ,获得积分10
11秒前
乖猫要努力应助nn采纳,获得10
11秒前
田様应助nn采纳,获得30
12秒前
李爱国应助APS采纳,获得10
12秒前
怕滑的企鹅完成签到 ,获得积分10
12秒前
高分求助中
【提示信息,请勿应助】关于scihub 10000
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
Social Research Methods (4th Edition) by Maggie Walter (2019) 2390
A new approach to the extrapolation of accelerated life test data 1000
北师大毕业论文 基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 390
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
Robot-supported joining of reinforcement textiles with one-sided sewing heads 360
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4009366
求助须知:如何正确求助?哪些是违规求助? 3549232
关于积分的说明 11301348
捐赠科研通 3283689
什么是DOI,文献DOI怎么找? 1810387
邀请新用户注册赠送积分活动 886217
科研通“疑难数据库(出版商)”最低求助积分说明 811301