Optimizing Hardware Accelerated General Matrix-Matrix Multiplication for CNNs on FPGAs

现场可编程门阵列 计算机科学 卷积(计算机科学) 矩阵乘法 卷积神经网络 巨量平行 并行计算 门阵列 推论 计算机体系结构 乘法(音乐) 高效能源利用 嵌入式系统 人工智能 人工神经网络 量子力学 量子 电气工程 物理 工程类 声学
作者
Afzal Ahmad,Muhammad Adeel Pasha
出处
期刊:IEEE Transactions on Circuits and Systems Ii-express Briefs [Institute of Electrical and Electronics Engineers]
卷期号:67 (11): 2692-2696 被引量:26
标识
DOI:10.1109/tcsii.2020.2965154
摘要

Convolution is inarguably the most complex operation utilized in Convolutional Neural Networks (convnets). Owing to the billions of independent multiply-adds involved, convolution is being massively parallelized by the simultaneous utilization of many cores of Graphical Processing Units (GPUs). Although GPUs have shown significant performance improvements in both training and inference stages, they are not well-suited for mobile vision applications where both energy and real-time constraints need to be satisfied. In contrast, Field Programmable Gate Arrays (FPGAs) have demonstrated massive parallelization capabilities, with fast DSPs and on-chip memory, at a lower energy cost than GPUs. Hence, they are being utilized to design convnet accelerators for embedded applications. In this brief, we design an FPGA-based accelerator for general matrix-matrix multiplication (GeMM) to improve the efficiency of convolutional layers of Shufflenet, an efficient convnet architecture. Experimental results show significant performance improvements against the state-of-the-art FPGA-based implementations of both efficient convnets that are tailored towards mobile vision applications, and complex convnets that are used in traditional applications.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Lingkoi发布了新的文献求助10
刚刚
所所应助LYZSh采纳,获得10
1秒前
1秒前
home完成签到,获得积分10
2秒前
yikiann发布了新的文献求助30
2秒前
喜悦发布了新的文献求助10
5秒前
烟花应助Annie采纳,获得10
5秒前
浮游应助Cc采纳,获得10
5秒前
6秒前
沐木锦李发布了新的文献求助10
6秒前
量子星尘发布了新的文献求助10
7秒前
7秒前
Lingkoi完成签到,获得积分10
7秒前
烟花应助出离离离采纳,获得10
7秒前
科研通AI6应助虚幻平露采纳,获得10
8秒前
迅速的小天鹅完成签到,获得积分10
8秒前
哈哈哈完成签到,获得积分10
8秒前
8秒前
10秒前
无极微光应助念l采纳,获得20
10秒前
田様应助XRT采纳,获得10
10秒前
852应助李李采纳,获得10
10秒前
CC关闭了CC文献求助
10秒前
poki发布了新的文献求助10
12秒前
小阿发发布了新的文献求助10
12秒前
13秒前
J1n9z完成签到,获得积分10
14秒前
赘婿应助zjh11143采纳,获得10
14秒前
14秒前
qqqq_8发布了新的文献求助10
14秒前
bkagyin应助sa采纳,获得10
15秒前
15秒前
wang完成签到,获得积分10
15秒前
Yuanyuan发布了新的文献求助10
16秒前
Hello应助吕凯迪采纳,获得10
17秒前
17秒前
17秒前
xueshu发布了新的文献求助10
17秒前
朴素的向雁完成签到,获得积分10
18秒前
裂冰完成签到,获得积分10
18秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
2025-2031全球及中国金刚石触媒粉行业研究及十五五规划分析报告 9000
Encyclopedia of the Human Brain Second Edition 8000
Translanguaging in Action in English-Medium Classrooms: A Resource Book for Teachers 700
Real World Research, 5th Edition 680
Qualitative Data Analysis with NVivo By Jenine Beekhuyzen, Pat Bazeley · 2024 660
Chemistry and Biochemistry: Research Progress Vol. 7 600
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5684190
求助须知:如何正确求助?哪些是违规求助? 5035564
关于积分的说明 15183757
捐赠科研通 4843529
什么是DOI,文献DOI怎么找? 2596718
邀请新用户注册赠送积分活动 1549418
关于科研通互助平台的介绍 1507952