亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Machine Learning in Environmental Research: Common Pitfalls and Best Practices

计算机科学 虚假关系 特征选择 机器学习 数据预处理 预处理器 数据科学 随机性 破译 过程(计算) 数据挖掘 人工智能 环境数据 管理科学 工程类 统计 数学 操作系统 生物 遗传学 法学 政治学
作者
Jun‐Jie Zhu,Meiqi Yang,Zhiyong Jason Ren
出处
期刊:Environmental Science & Technology [American Chemical Society]
卷期号:57 (46): 17671-17689 被引量:203
标识
DOI:10.1021/acs.est.3c00026
摘要

Machine learning (ML) is increasingly used in environmental research to process large data sets and decipher complex relationships between system variables. However, due to the lack of familiarity and methodological rigor, inadequate ML studies may lead to spurious conclusions. In this study, we synthesized literature analysis with our own experience and provided a tutorial-like compilation of common pitfalls along with best practice guidelines for environmental ML research. We identified more than 30 key items and provided evidence-based data analysis based on 148 highly cited research articles to exhibit the misconceptions of terminologies, proper sample size and feature size, data enrichment and feature selection, randomness assessment, data leakage management, data splitting, method selection and comparison, model optimization and evaluation, and model explainability and causality. By analyzing good examples on supervised learning and reference modeling paradigms, we hope to help researchers adopt more rigorous data preprocessing and model development standards for more accurate, robust, and practicable model uses in environmental research and applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小二郎应助科研通管家采纳,获得10
8秒前
CipherSage应助科研通管家采纳,获得10
8秒前
科研通AI2S应助科研通管家采纳,获得10
8秒前
Yuan应助科研通管家采纳,获得10
8秒前
汉堡包应助科研通管家采纳,获得20
9秒前
科研通AI5应助黄景瑜采纳,获得10
33秒前
完美世界应助VDC采纳,获得10
43秒前
冰姗完成签到,获得积分10
55秒前
1分钟前
李健的小迷弟应助X_L_iang采纳,获得10
1分钟前
黄景瑜发布了新的文献求助10
1分钟前
1分钟前
北落师门发布了新的文献求助10
1分钟前
1分钟前
2分钟前
小人物发布了新的文献求助10
2分钟前
VDC发布了新的文献求助10
2分钟前
赘婿应助科研通管家采纳,获得10
2分钟前
Yuan应助科研通管家采纳,获得10
2分钟前
共享精神应助小人物采纳,获得10
2分钟前
小人物完成签到,获得积分10
2分钟前
英姑应助VDC采纳,获得10
3分钟前
thchiang完成签到 ,获得积分10
3分钟前
3分钟前
3分钟前
X_L_iang发布了新的文献求助10
3分钟前
VDC发布了新的文献求助10
3分钟前
3分钟前
6分钟前
qing发布了新的文献求助10
6分钟前
7分钟前
clairevox完成签到,获得积分10
7分钟前
clairevox发布了新的文献求助10
7分钟前
7分钟前
你当像鸟飞往你的山完成签到 ,获得积分10
7分钟前
qing发布了新的文献求助10
7分钟前
7分钟前
qing发布了新的文献求助10
7分钟前
JamesPei应助科研通管家采纳,获得10
8分钟前
852应助ling361采纳,获得10
8分钟前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
Evaluating the Cardiometabolic Efficacy and Safety of Lipoprotein Lipase Pathway Targets in Combination With Approved Lipid-Lowering Targets: A Drug Target Mendelian Randomization Study 500
Crystal Nonlinear Optics: with SNLO examples (Second Edition) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3733402
求助须知:如何正确求助?哪些是违规求助? 3277618
关于积分的说明 10003453
捐赠科研通 2993632
什么是DOI,文献DOI怎么找? 1642785
邀请新用户注册赠送积分活动 780641
科研通“疑难数据库(出版商)”最低求助积分说明 748912