Missing value imputation for the analysis of incomplete traffic accident data

插补(统计学) 缺少数据 范畴变量 人口 运输工程 计算机科学 统计 地理 工程类 环境卫生 医学 数学
作者
Rupam Deb,Alan Wee‐Chung Liew
出处
期刊:Information Sciences [Elsevier]
卷期号:339: 274-289 被引量:95
标识
DOI:10.1016/j.ins.2016.01.018
摘要

Death, injury and disability resulting from road traffic crashes continue to be a major global public health problem. Recent data suggest that the number of fatalities from traffic crashes is in excess of 1.25 million people each year with non-fatal injuries affecting a further 20–50 million people. It is predicted that by 2030 road traffic accidents will have progressed to be the 5th leading cause of death and that the number of people who will die annually from traffic accidents will have doubled from current levels. Both developed and developing countries suffer from the consequences of increase in human population, and therefore, vehicle population. Therefore, methods to reduce accident severity are of great interest to traffic agencies and the public at large. To analyse traffic accident factors effectively we need a complete traffic accident historical database. Any missing data in the database could prevent the discovery of important environmental and road accident factors and lead to invalid conclusions. In this paper, we present a novel imputation method that exploits the within-record and between-record correlations to impute missing data of numerical or categorical values. In addition, our algorithm accounts for uncertainty in real world data by sampling from a list of potential imputed values according to their affinity degree. We evaluated our algorithm using four publicly available traffic accident databases from the United States, the first of which is the largest open federal database (explore.data.gov) in the United States, and the second is based on the National Incident Based Reporting System (NIBRS) of the city and county of Denver (data.opencolorado.org). The other two are from New York's open data portal (Motor Vehicle Crashes-case information: 2011 and Motor Vehicle Crashes-individual information: 2011, data.ny.gov). We compare our algorithm with four state-of-the-art imputation methods using missing value imputation accuracy and RMSE. Our results indicate that the proposed method performs significantly better than the existing algorithms we compared.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
haru完成签到,获得积分10
6秒前
宝宝完成签到 ,获得积分10
12秒前
yinyin完成签到 ,获得积分10
12秒前
袁雪蓓完成签到 ,获得积分10
48秒前
xyyyy完成签到 ,获得积分10
52秒前
体贴问丝完成签到 ,获得积分10
53秒前
caroline完成签到 ,获得积分10
1分钟前
回首不再是少年完成签到,获得积分0
1分钟前
1分钟前
1分钟前
迅速千愁完成签到 ,获得积分10
1分钟前
1分钟前
欣喜的跳跳糖完成签到 ,获得积分10
1分钟前
CcC发布了新的文献求助10
1分钟前
芝士奶盖有点咸完成签到 ,获得积分10
1分钟前
科研通AI2S应助研友_8WOBM8采纳,获得10
1分钟前
lyy完成签到 ,获得积分10
1分钟前
研友_8WOBM8完成签到,获得积分10
1分钟前
juana完成签到 ,获得积分10
1分钟前
1分钟前
一墨发布了新的文献求助30
1分钟前
模糊中正应助研友_8WOBM8采纳,获得30
1分钟前
吃小孩的妖怪完成签到 ,获得积分10
1分钟前
科研通AI2S应助研友_8WOBM8采纳,获得10
1分钟前
新奇完成签到 ,获得积分10
2分钟前
清秀的之桃完成签到 ,获得积分10
2分钟前
大雁完成签到 ,获得积分10
2分钟前
阿尔法贝塔完成签到 ,获得积分10
2分钟前
科研通AI2S应助研友_8WOBM8采纳,获得10
2分钟前
apckkk完成签到 ,获得积分10
2分钟前
万能图书馆应助研友_8WOBM8采纳,获得10
2分钟前
cadcae完成签到,获得积分10
2分钟前
大力水手完成签到,获得积分10
2分钟前
小白完成签到 ,获得积分10
2分钟前
chichenglin完成签到 ,获得积分10
2分钟前
美满的皮卡丘完成签到 ,获得积分10
2分钟前
czj完成签到 ,获得积分10
3分钟前
星寒完成签到 ,获得积分10
3分钟前
清脆的大开完成签到,获得积分10
3分钟前
PDIF-CN2完成签到,获得积分10
3分钟前
高分求助中
Востребованный временем 2500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1500
Very-high-order BVD Schemes Using β-variable THINC Method 1200
Early Devonian echinoderms from Victoria (Rhombifera, Blastoidea and Ophiocistioidea) 1000
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
The Collected Works of Jeremy Bentham: Rights, Representation, and Reform: Nonsense upon Stilts and Other Writings on the French Revolution 320
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3365223
求助须知:如何正确求助?哪些是违规求助? 2985788
关于积分的说明 8719687
捐赠科研通 2668185
什么是DOI,文献DOI怎么找? 1461254
科研通“疑难数据库(出版商)”最低求助积分说明 676273
邀请新用户注册赠送积分活动 667665