Significance tests or confidence intervals: which are preferable for the comparison of classifiers?

置信区间 无效假设 计算机科学 统计假设检验 样本量测定 统计 光学(聚焦) 人工智能 统计显著性 机器学习 数学 光学 物理
作者
Daniel Berrar,José A. Lozano
出处
期刊:Journal of Experimental and Theoretical Artificial Intelligence [Informa]
卷期号:25 (2): 189-206 被引量:22
标识
DOI:10.1080/0952813x.2012.680252
摘要

Null hypothesis significance tests and their p-values currently dominate the statistical evaluation of classifiers in machine learning. Here, we discuss fundamental problems of this research practice. We focus on the problem of comparing multiple fully specified classifiers on a small-sample test set. On the basis of the method by Quesenberry and Hurst, we derive confidence intervals for the effect size, i.e. the difference in true classification performance. These confidence intervals disentangle the effect size from its uncertainty and thereby provide information beyond the p-value. This additional information can drastically change the way in which classification results are currently interpreted, published and acted upon. We illustrate how our reasoning can change, depending on whether we focus on p-values or confidence intervals. We argue that the conclusions from comparative classification studies should be based primarily on effect size estimation with confidence intervals, and not on significance tests and p-values.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
Jaslin完成签到,获得积分10
3秒前
似水流年发布了新的文献求助10
4秒前
4秒前
康康发布了新的文献求助30
5秒前
5秒前
5秒前
在郑州发布了新的文献求助10
5秒前
kakaC发布了新的文献求助10
6秒前
scinanpro完成签到 ,获得积分10
7秒前
renpp822发布了新的文献求助30
7秒前
深情的采波完成签到,获得积分10
9秒前
华仔应助妙手回春板蓝根采纳,获得10
9秒前
EVE驳回了小蘑菇应助
10秒前
10秒前
科研通AI2S应助jianrobsim采纳,获得10
10秒前
地塞米松磷酸钠完成签到,获得积分10
12秒前
Singularity应助缥缈诺言采纳,获得10
12秒前
FashionBoy应助平淡翎采纳,获得10
12秒前
乐乐发布了新的文献求助10
12秒前
plh完成签到,获得积分10
13秒前
13秒前
14秒前
15秒前
16秒前
打翻了一罐温柔完成签到,获得积分10
17秒前
17秒前
情怀应助妮妮你采纳,获得10
17秒前
LLLLLL发布了新的文献求助10
18秒前
2024_08_09完成签到,获得积分20
18秒前
19秒前
含蓄延恶发布了新的文献求助10
19秒前
伈X发布了新的文献求助30
19秒前
舒心宛白完成签到 ,获得积分10
19秒前
hyx完成签到,获得积分10
19秒前
菠萝肉完成签到,获得积分10
20秒前
丘比特应助天天采纳,获得10
21秒前
小熊发布了新的文献求助10
22秒前
JamesPei应助在郑州采纳,获得10
23秒前
23秒前
高分求助中
Evolution 10000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 600
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3156848
求助须知:如何正确求助?哪些是违规求助? 2808269
关于积分的说明 7877026
捐赠科研通 2466691
什么是DOI,文献DOI怎么找? 1312998
科研通“疑难数据库(出版商)”最低求助积分说明 630334
版权声明 601919