An Ensemble Machine-Learning Model To Predict Historical PM2.5Concentrations in China from Satellite Data

均方误差 后发 随机森林 梯度升压 聚类分析 集合预报 集成学习 数据集 统计 计算机科学 人工智能 机器学习 数学
作者
Qingyang Xiao,Howard H. Chang,Guannan Geng,Yang Liu
出处
期刊:Environmental Science & Technology [American Chemical Society]
卷期号:52 (22): 13260-13269 被引量:311
标识
DOI:10.1021/acs.est.8b02917
摘要

The long satellite aerosol data record enables assessments of historical PM2.5 level in regions where routine PM2.5 monitoring began only recently. However, most previous models reported decreased prediction accuracy when predicting PM2.5 levels outside the model-training period. In this study, we proposed an ensemble machine learning approach that provided reliable PM2.5 hindcast capabilities. The missing satellite data were first filled by multiple imputation. Then the modeling domain, China, was divided into seven regions using a spatial clustering method to control for unobserved spatial heterogeneity. A set of machine learning models including random forest, generalized additive model, and extreme gradient boosting were trained in each region separately. Finally, a generalized additive ensemble model was developed to combine predictions from different algorithms. The ensemble prediction characterized the spatiotemporal distribution of daily PM2.5 well with the cross-validation (CV) R2 (RMSE) of 0.79 (21 μg/m3). The cluster-based subregion models outperformed national models and improved the CV R2 by ∼0.05. Compared with previous studies, our model provided more accurate out-of-range predictions at the daily level ( R2 = 0.58, RMSE = 29 μg/m3) and monthly level ( R2 = 0.76, RMSE = 16 μg/m3). Our hindcast modeling system allows for the construction of unbiased historical PM2.5 levels.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
雨柏完成签到 ,获得积分10
刚刚
刚刚
科研菜鸡623完成签到,获得积分10
1秒前
找找发布了新的文献求助10
2秒前
汪三十应助文件撤销了驳回
3秒前
sciq完成签到,获得积分10
3秒前
3秒前
温柔的语柔完成签到,获得积分10
6秒前
深情安青应助luxiaoyu采纳,获得10
6秒前
7秒前
荧123456发布了新的文献求助10
7秒前
7秒前
7秒前
忧郁书双发布了新的文献求助10
8秒前
11秒前
xiaoxiao发布了新的文献求助10
12秒前
科研通AI2S应助小王采纳,获得10
12秒前
神羊发布了新的文献求助10
13秒前
13秒前
15秒前
法侣完成签到,获得积分10
16秒前
但大图完成签到 ,获得积分10
17秒前
瑞葛发布了新的文献求助10
17秒前
烟花应助落寞丹烟采纳,获得10
18秒前
19秒前
Hello应助HJJHJH采纳,获得10
20秒前
21秒前
zzy发布了新的文献求助10
21秒前
bobo发布了新的文献求助10
22秒前
luxiaoyu发布了新的文献求助10
24秒前
25秒前
顾矜应助Ivychao采纳,获得10
25秒前
ttqql发布了新的文献求助10
27秒前
29秒前
30秒前
小王博士发布了新的文献求助10
32秒前
sci666发布了新的文献求助10
33秒前
独特的谷雪完成签到,获得积分10
33秒前
galeno发布了新的文献求助10
35秒前
37秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3737788
求助须知:如何正确求助?哪些是违规求助? 3281410
关于积分的说明 10025130
捐赠科研通 2998123
什么是DOI,文献DOI怎么找? 1645087
邀请新用户注册赠送积分活动 782525
科研通“疑难数据库(出版商)”最低求助积分说明 749835