已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

ICLA Unit: Intra-Cluster Locality-Aware Unit to Reduce L2 Access and NoC Pressure in GPGPUs

计算机科学 隐藏物 地点 并行计算 库达 线程(计算) 延迟(音频) 计算机网络 操作系统 语言学 电信 哲学
作者
Siamak Biglari Ardabili,Gholamreza Zare Fatin
出处
期刊:Journal of Circuits, Systems, and Computers [World Scientific]
卷期号:: 2250015-2250015
标识
DOI:10.1142/s0218126622500153
摘要

As the number of streaming multiprocessors (SMs) in GPUs increases, in order to gain better performance, the reply network faces heavy traffic. This causes congestion on Network-on-Chip (NoC) routers and memory controller’s (MC) buffers. By taking advantage of cooperative thread arrays (CTAs) that are scheduled locally in clusters, there is a high probability of finding the same copy of data in other SM’s [Formula: see text] cache in the same cluster. In order to make this feasible, it is necessary for the SMs to have access to local [Formula: see text] cache of the neighboring SMs. There is a considerable congestion in NoC due to unique traffic pattern called many-to-few-to-many. Thanks to the reduced number of requests that is attained by our proposed Intra-Cluster Locality-Aware (ICLA) unit, this congested replying network traffic becomes many-to-many traffic pattern and the replied data goes through the less-utilized core-to-core communication that mitigates the NoC traffic. The proposed architecture in this paper has been evaluated using 15 different workloads from CUDA SDK, Rodinia, and ISPASS2009 benchmarks. The proposed ICLA unit has been modeled and simulated in the GPGPU-Sim. The results show about 23.79% (up to 49.82%) reduction in average network latency, 15.49% (up to 36.82%) reduction in average [Formula: see text] cache access, and 18.18% (up to 58.1%) average improvement in the instruction per cycle (IPC).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
6秒前
香蕉觅云应助曾经凌萱采纳,获得10
9秒前
9秒前
12123浪发布了新的文献求助10
13秒前
握瑾怀瑜完成签到 ,获得积分0
15秒前
今后应助壮观若南采纳,获得10
15秒前
LanceHayward完成签到 ,获得积分10
17秒前
噜啦啦完成签到 ,获得积分10
19秒前
yyy完成签到 ,获得积分10
19秒前
23秒前
cc完成签到 ,获得积分10
26秒前
三年半完成签到,获得积分10
26秒前
刻苦的悟空完成签到,获得积分10
27秒前
澳澳发布了新的文献求助10
30秒前
风中黎昕完成签到 ,获得积分10
31秒前
37秒前
42秒前
L1完成签到 ,获得积分10
44秒前
缺牙齿完成签到,获得积分10
44秒前
48秒前
50秒前
天天快乐应助澳澳采纳,获得10
52秒前
WASAS发布了新的文献求助10
55秒前
量子星尘发布了新的文献求助10
57秒前
朴素的尔蝶完成签到 ,获得积分10
58秒前
隐形曼青应助WASAS采纳,获得10
59秒前
liuye0202完成签到,获得积分10
59秒前
小武完成签到,获得积分10
1分钟前
1分钟前
Dceer发布了新的文献求助10
1分钟前
1分钟前
寻道图强完成签到,获得积分0
1分钟前
Owen应助LEOJAY采纳,获得10
1分钟前
爆裂魔法使完成签到,获得积分10
1分钟前
搜集达人应助咪咪咪咪咪采纳,获得10
1分钟前
1分钟前
ceeray23应助科研通管家采纳,获得10
1分钟前
ho应助科研通管家采纳,获得10
1分钟前
酷炫问儿应助科研通管家采纳,获得20
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.).. Frederic G. Reamer 1070
2025-2031年中国兽用抗生素行业发展深度调研与未来趋势报告 1000
按地区划分的1,091个公共养老金档案列表 801
The International Law of the Sea (fourth edition) 800
A Guide to Genetic Counseling, 3rd Edition 500
Synthesis and properties of compounds of the type A (III) B2 (VI) X4 (VI), A (III) B4 (V) X7 (VI), and A3 (III) B4 (V) X9 (VI) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5412973
求助须知:如何正确求助?哪些是违规求助? 4530250
关于积分的说明 14122705
捐赠科研通 4445166
什么是DOI,文献DOI怎么找? 2439107
邀请新用户注册赠送积分活动 1431181
关于科研通互助平台的介绍 1408536