Accelerating Attention Mechanism on FPGAs based on Efficient Reconfigurable Systolic Array

计算机科学 现场可编程门阵列 计算 收缩阵列 高效能源利用 计算机体系结构 嵌入式系统 可重组计算 门阵列 并行计算 计算机硬件 算法 超大规模集成 电气工程 工程类
作者
Wenhua Ye,Xu Zhou,Joey Tianyi Zhou,Cen Chen,Kenli Li
出处
期刊:ACM Transactions in Embedded Computing Systems [Association for Computing Machinery]
卷期号:22 (6): 1-22 被引量:16
标识
DOI:10.1145/3549937
摘要

Transformer model architectures have recently received great interest in natural language, machine translation, and computer vision, where attention mechanisms are their building blocks. However, the attention mechanism is expensive because of its intensive matrix computations and complicated data flow. The existing hardware architecture has some disadvantages for the computing structure of attention, such as inflexibility and low efficiency. Most of the existing papers accelerate attention by reducing the amount of computation through various pruning algorithms, which will affect the results to a certain extent with different sparsity. This paper proposes the hardware accelerator for the multi-head attention (MHA) on field-programmable gate arrays (FPGAs) with reconfigurable architecture, efficient systolic array, and hardware-friendly radix-2 softmax. We propose a novel method called Four inputs Processing Element (FPE) to double the computation rate of the data-aware systolic array (SA) and make it efficient and load balance. Especially, the computation framework is well designed to ensure the utilization of SA efficiently. Our design is evaluated on a Xilinx Alveo U250 card, and the proposed architecture achieves 51.3×, 17.3× improvement in latency, and 54.4×, 17.9× energy savings compared to CPU and GPU.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
诚心谷南发布了新的文献求助10
4秒前
一修完成签到,获得积分10
5秒前
开心的半仙完成签到 ,获得积分10
6秒前
李健的粉丝团团长应助111采纳,获得10
6秒前
7秒前
SYLH应助对于采纳,获得10
8秒前
酷波er应助Serendipity采纳,获得10
8秒前
9秒前
充电宝应助xiaowanzi采纳,获得10
10秒前
10秒前
爱吃冻梨完成签到,获得积分10
10秒前
10秒前
haoryan完成签到,获得积分10
12秒前
Castiron完成签到 ,获得积分10
12秒前
12秒前
13秒前
kkkhhh完成签到,获得积分10
13秒前
13秒前
YIXIN完成签到 ,获得积分20
14秒前
16秒前
17秒前
Richard发布了新的文献求助10
17秒前
17秒前
A_child完成签到,获得积分20
18秒前
李大海发布了新的文献求助10
18秒前
kkkhhh发布了新的文献求助10
18秒前
小栗子完成签到,获得积分10
18秒前
ZZRR完成签到,获得积分10
19秒前
华仔应助美满的金连采纳,获得10
20秒前
内向的静曼完成签到,获得积分10
20秒前
科研小白发布了新的文献求助10
20秒前
20秒前
大模型应助Wd采纳,获得10
20秒前
忧郁静丹发布了新的文献求助10
21秒前
猪猪hero应助lzb采纳,获得10
22秒前
22秒前
abab发布了新的文献求助10
22秒前
科研通AI5应助yuzhi采纳,获得10
22秒前
23秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3737113
求助须知:如何正确求助?哪些是违规求助? 3280963
关于积分的说明 10022154
捐赠科研通 2997689
什么是DOI,文献DOI怎么找? 1644711
邀请新用户注册赠送积分活动 782139
科研通“疑难数据库(出版商)”最低求助积分说明 749707