Tightly Coupled Machine Learning Coprocessor Architecture With Analog In-Memory Computing for Instruction-Level Acceleration

计算机科学 协处理器 编译程序 隐藏物 嵌入式系统 计算机体系结构 并行计算 计算机硬件 操作系统
作者
SungWon Chung,Jiemi Wang
出处
期刊:IEEE Journal on Emerging and Selected Topics in Circuits and Systems [Institute of Electrical and Electronics Engineers]
卷期号:9 (3): 544-561 被引量:5
标识
DOI:10.1109/jetcas.2019.2934929
摘要

Low-profile mobile computing platforms often need to execute a variety of machine learning algorithms with limited memory and processing power. To address this challenge, this work presents Coara, an instruction-level processor acceleration architecture, which efficiently integrates an approximate analog in-memory computing coprocessor for accelerating general machine learning applications by exploiting analog register file cache. The instruction-level acceleration offers true programmability beyond the degree of freedom provided by reconfigurable machine learning accelerators, and also allows the code generation stage of a compiler back-end to control the coprocessor execution and data flow, so that applications do not need highlevel machine learning software frameworks with a large memory footprint. Conventional analog and mixed-signal accelerators suffer from the overhead of frequent data conversion between analog and digital signals. To solve this classical problem, Coara uses an analog register file cache, which interfaces the analog in-memory computing coprocessor with the digital register file of the processor core. As a result, more than 90% of data conversion overhead with ADC and DAC can be eliminated by temporarily storing the result of analog computation in a switched-capacitor analog memory cell until data dependency occurs. Cycle-accurate Verilog RTL model of the proposed architecture is evaluated with 45 nm CMOS technology parameters while executing machine learning benchmark computation codes that are generated by a customized cross-compiler without using machine learning software frameworks.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
冷酷的白梅完成签到,获得积分10
刚刚
zhangshan完成签到,获得积分10
刚刚
慕冰蝶发布了新的文献求助10
刚刚
脑洞疼应助呀呀呀采纳,获得10
2秒前
伯桦完成签到,获得积分10
2秒前
姚昂发布了新的文献求助10
2秒前
高冰冰发布了新的文献求助10
2秒前
盐焗小星球完成签到 ,获得积分10
3秒前
嘟嘟豆806完成签到 ,获得积分0
4秒前
7秒前
9秒前
赘婿应助liuzhanyu采纳,获得10
9秒前
科研通AI6.1应助姚昂采纳,获得30
11秒前
陶醉难胜发布了新的文献求助10
11秒前
东风徐来完成签到,获得积分10
11秒前
稳重的向日葵完成签到,获得积分10
12秒前
13秒前
13秒前
忆修完成签到,获得积分10
15秒前
科研小怪发布了新的文献求助10
15秒前
fighting完成签到,获得积分10
16秒前
马婷婷完成签到,获得积分10
17秒前
科研通AI2S应助steam采纳,获得10
19秒前
after_17完成签到,获得积分10
19秒前
20秒前
20秒前
熊雅完成签到,获得积分10
20秒前
Qiaoqiao完成签到,获得积分10
20秒前
快乐的问儿完成签到,获得积分10
20秒前
21秒前
夏夏完成签到,获得积分10
22秒前
jkhjkhj发布了新的文献求助10
23秒前
baa完成签到,获得积分10
23秒前
deng完成签到 ,获得积分10
23秒前
24秒前
LLLL发布了新的文献求助10
24秒前
张巨锋完成签到,获得积分10
24秒前
jiangshanshan发布了新的文献求助10
24秒前
怡然的姿发布了新的文献求助10
25秒前
steam完成签到,获得积分10
25秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Developing Genetic Editing Tools for Lysobacter 2000
卤化钙钛矿人工突触的研究 2000
Моделирование процессов самоорганизации в кристаллообразующих системах 1000
History of U.S. Space Surveillance and Satellite Cataloging 1000
Malcolm Fraser : a biography 700
Handbook of Optical Systems,Volume 6:Advanced Physical Optics 666
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6512685
求助须知:如何正确求助?哪些是违规求助? 8306136
关于积分的说明 17744249
捐赠科研通 5614594
什么是DOI,文献DOI怎么找? 2923820
邀请新用户注册赠送积分活动 1901060
关于科研通互助平台的介绍 1762776