已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Machine Learning-enabled Performance Model for DNN Applications and AI Accelerator

计算机科学 数据流 人工智能 编译程序 机器学习 软件 人工神经网络 瓶颈 深度学习 源代码 图形 计算机体系结构 程序设计语言 并行计算 理论计算机科学 嵌入式系统
作者
Ruohan Wu,Mingfan Li,Hanxi Li,Tianxiang Chen,Xinghui Tian,Xiaoxin Xu,Bin Zhou,Junshi Chen,Hong An
标识
DOI:10.1109/hpcc-dss-smartcity-dependsys57074.2022.00038
摘要

As innovations in deep learning systems and deep neural network (DNN) models continue to grow, accurate performance analysis acts as a promising tool for understanding and navigating the complex software-hardware interplay, especially for the today's heterogeneous AI architecture. However, the actual execution of DNNs on the dedicated accelerators involves chal-lenges from nontrivial dataflow graph analysis, tensor compiler optimizations, and operator performance prediction. In this work, we propose a two-stage performance model framework that combines graph-level analysis and operator-based hotspot modeling to bridge the gap between high-level application performance and its software-hardware systems. By the employ of machine learning (ML) solution, our performance model further captures the low-level hardware-dependent information, including operator fusion and data layout transformation. Our graph analysis for mainstream models from computer vision (CV), natural language processing (NLP) and recommendation domains selects total 26 kinds of operators and builds a dataset on the Huawei Ascend 910. With the well-trained model, our open source 1 1 Source code available at https://github.com/Huawei-Performance-Model/Ascend-910b performance model finally achieves 15.4 % average error for predicting the execution time of DNN models, and our modeling for memory access and performance bottleneck supports efficient running of DNN models for future systems.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
ET发布了新的文献求助10
4秒前
iKUN发布了新的文献求助10
5秒前
二丙完成签到 ,获得积分10
7秒前
隐形曼青应助Zw采纳,获得10
14秒前
19秒前
24秒前
26秒前
小二郎应助三块石头采纳,获得10
34秒前
zqh关闭了zqh文献求助
38秒前
自信的电灯胆完成签到,获得积分10
39秒前
郝富完成签到,获得积分10
44秒前
45秒前
peace发布了新的文献求助10
46秒前
天天完成签到 ,获得积分10
47秒前
hty发布了新的文献求助20
49秒前
酷酷银耳汤完成签到,获得积分10
51秒前
三块石头发布了新的文献求助10
51秒前
三块石头完成签到,获得积分10
55秒前
peace完成签到,获得积分20
57秒前
1分钟前
平常的过客完成签到,获得积分10
1分钟前
科研小学生完成签到,获得积分10
1分钟前
1分钟前
哭泣的丝完成签到 ,获得积分10
1分钟前
1分钟前
浮云寄川发布了新的文献求助10
1分钟前
嗯哼完成签到,获得积分0
1分钟前
诺亚完成签到,获得积分10
1分钟前
Jeremy发布了新的文献求助10
1分钟前
1分钟前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
勤奋曼雁完成签到,获得积分10
1分钟前
宇宙之王宙斯完成签到 ,获得积分10
1分钟前
鲨猫收藏家完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
JiaWong发布了新的文献求助10
1分钟前
昱珂发布了新的文献求助10
1分钟前
重要问芙brk完成签到,获得积分10
1分钟前
高分求助中
Bayesian Models of Cognition:Reverse Engineering the Mind 800
Essentials of thematic analysis 700
A Dissection Guide & Atlas to the Rabbit 600
Very-high-order BVD Schemes Using β-variable THINC Method 568
Внешняя политика КНР: о сущности внешнеполитического курса современного китайского руководства 500
Academia de Coimbra: 1537-1990: história, praxe, boémia e estudo, partidas e piadas, organismos académicos 500
Revolution und Konterrevolution in China [by A. Losowsky] 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3121531
求助须知:如何正确求助?哪些是违规求助? 2772022
关于积分的说明 7710636
捐赠科研通 2427386
什么是DOI,文献DOI怎么找? 1289191
科研通“疑难数据库(出版商)”最低求助积分说明 621343
版权声明 600107