Model Evaluation, Model Selection, and Algorithm Selection in Machine Learning

自举(财务) 机器学习 计算机科学 选择(遗传算法) 交叉验证 人工智能 差异(会计) 选型 算法 数据挖掘 数学 计量经济学 会计 业务
作者
Sebastian Raschka
出处
期刊:Cornell University - arXiv 被引量:460
标识
DOI:10.48550/arxiv.1811.12808
摘要

The correct use of model evaluation, model selection, and algorithm selection techniques is vital in academic machine learning research as well as in many industrial settings. This article reviews different techniques that can be used for each of these three subtasks and discusses the main advantages and disadvantages of each technique with references to theoretical and empirical studies. Further, recommendations are given to encourage best yet feasible practices in research and applications of machine learning. Common methods such as the holdout method for model evaluation and selection are covered, which are not recommended when working with small datasets. Different flavors of the bootstrap technique are introduced for estimating the uncertainty of performance estimates, as an alternative to confidence intervals via normal approximation if bootstrapping is computationally feasible. Common cross-validation techniques such as leave-one-out cross-validation and k-fold cross-validation are reviewed, the bias-variance trade-off for choosing k is discussed, and practical tips for the optimal choice of k are given based on empirical evidence. Different statistical tests for algorithm comparisons are presented, and strategies for dealing with multiple comparisons such as omnibus tests and multiple-comparison corrections are discussed. Finally, alternative methods for algorithm selection, such as the combined F-test 5x2 cross-validation and nested cross-validation, are recommended for comparing machine learning algorithms when datasets are small.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
zzh12138发布了新的文献求助30
1秒前
xx完成签到,获得积分10
1秒前
现代百招完成签到,获得积分10
4秒前
5秒前
无限平凡发布了新的文献求助10
5秒前
阿托伐他汀完成签到 ,获得积分10
5秒前
酷波er应助haokeyan采纳,获得10
7秒前
英姑应助jia采纳,获得10
7秒前
7秒前
7秒前
liyutong完成签到 ,获得积分10
8秒前
疯狂的海亦完成签到,获得积分20
8秒前
高高元柏完成签到,获得积分10
9秒前
9秒前
10秒前
10秒前
小二郎应助zzh12138采纳,获得10
11秒前
三土有兀完成签到,获得积分10
11秒前
hhww完成签到,获得积分10
11秒前
12秒前
Docgyj完成签到 ,获得积分10
12秒前
Accept发布了新的文献求助30
12秒前
12秒前
12秒前
13秒前
hhww发布了新的文献求助10
14秒前
虚心的如曼完成签到 ,获得积分10
15秒前
tianxiong发布了新的文献求助10
16秒前
唐同学发布了新的文献求助10
16秒前
17秒前
Ashore完成签到,获得积分10
18秒前
Tyy发布了新的文献求助10
18秒前
ikun发布了新的文献求助10
18秒前
WHR完成签到,获得积分10
19秒前
blue完成签到 ,获得积分10
19秒前
所所应助疯狂的海亦采纳,获得10
19秒前
科研通AI2S应助神勇雨双采纳,获得10
20秒前
迷路桃子发布了新的文献求助10
20秒前
传奇3应助dopamine采纳,获得10
21秒前
22秒前
高分求助中
The late Devonian Standard Conodont Zonation 2000
Nickel superalloy market size, share, growth, trends, and forecast 2023-2030 2000
The Lali Section: An Excellent Reference Section for Upper - Devonian in South China 1500
Very-high-order BVD Schemes Using β-variable THINC Method 890
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 800
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3257985
求助须知:如何正确求助?哪些是违规求助? 2899850
关于积分的说明 8307829
捐赠科研通 2569098
什么是DOI,文献DOI怎么找? 1395469
科研通“疑难数据库(出版商)”最低求助积分说明 653107
邀请新用户注册赠送积分活动 630990