Predicting Uncorrectable Memory Errors from the Correctable Error History: No Free Predictors in the Field

计算机科学 均方预测误差 领域(数学) 服务器 预测建模 机器学习 过程(计算) 性能预测 人工智能 数据挖掘 模拟 操作系统 数学 纯数学
作者
Xiaoming Du,Cong Li
标识
DOI:10.1145/3488423.3519316
摘要

Being the major causes of hardware failures in datacenters, uncorrectable memory errors result in server crashes. In this paper, we address the problem of predicting uncorrectable errors (UEs) using the historical correctable error (CE) information. We first establish a new UE prediction framework of inferring latent memory faulty status from CE observations and correlating the inferred faulty status with the UE occurrences for prediction. We then design several predictors based on different memory fault modes and examine their performance on 4 datasets of memory errors from contemporary servers in datacenters of 3 top-tier technology companies. While in existing work, UE prediction is studied in a single environment only, this is the first comparative study on the prediction performance across datasets from different environments. Through the cross-dataset study, we demonstrate that predictors performing relatively well in some environments do not perform well in some other environments. The prediction performance are highly impacted by different characteristics in different environments and no free predictors are universally applicable. Finally, in order to capture the characteristics specific to each environment in UE prediction, we propose a properly designed learning process to induce a weighted ensemble of the predictors from the data and show that the ensemble predictor learned consistently outperforms the individual predictors within each dataset.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
羲x完成签到,获得积分10
2秒前
2秒前
知足的憨人*-*完成签到,获得积分10
2秒前
量子星尘发布了新的文献求助10
2秒前
3秒前
泥過发布了新的文献求助10
3秒前
ori12138发布了新的文献求助10
3秒前
andrele发布了新的文献求助10
4秒前
4秒前
徐凤年发布了新的文献求助10
5秒前
鲤鱼诗桃发布了新的文献求助10
5秒前
DOODBYE发布了新的文献求助10
5秒前
一切随风发布了新的文献求助10
5秒前
皮颤发布了新的文献求助10
8秒前
8秒前
泽mao发布了新的文献求助10
8秒前
8秒前
大气的莆完成签到,获得积分10
9秒前
12秒前
hlovey完成签到,获得积分10
12秒前
12秒前
万能图书馆应助jiang采纳,获得10
12秒前
科研通AI2S应助幻心采纳,获得10
13秒前
Lucas应助必福健采纳,获得10
14秒前
Hello应助拼搏半梦采纳,获得10
14秒前
14秒前
枫1538发布了新的文献求助10
15秒前
Mingchun发布了新的文献求助10
16秒前
维多利亚少年完成签到,获得积分10
16秒前
16秒前
CipherSage应助科研小白采纳,获得10
16秒前
谛听不听完成签到 ,获得积分10
18秒前
19秒前
希望天下0贩的0应助lvyuan采纳,获得10
19秒前
充电宝应助科研通管家采纳,获得10
19秒前
19秒前
泥過完成签到,获得积分10
19秒前
19秒前
田様应助科研通管家采纳,获得10
19秒前
脑洞疼应助科研通管家采纳,获得10
19秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Relation between chemical structure and local anesthetic action: tertiary alkylamine derivatives of diphenylhydantoin 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Principles of town planning : translating concepts to applications 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6065302
求助须知:如何正确求助?哪些是违规求助? 7897430
关于积分的说明 16320912
捐赠科研通 5207821
什么是DOI,文献DOI怎么找? 2786093
邀请新用户注册赠送积分活动 1768840
关于科研通互助平台的介绍 1647713