亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

SMOTE: Synthetic Minority Over-sampling Technique

过采样 分类器(UML) 朴素贝叶斯分类器 人工智能 计算机科学 接收机工作特性 先验概率 班级(哲学) 凸壳 数学 机器学习 采样(信号处理) 贝叶斯概率 模式识别(心理学) 统计 支持向量机 正多边形 带宽(计算) 滤波器(信号处理) 几何学 计算机视觉 计算机网络
作者
Nitesh V. Chawla,Kevin W. Bowyer,Lawrence Hall,W. Philip Kegelmeyer
出处
期刊:Journal of Artificial Intelligence Research [AI Access Foundation]
卷期号:16: 321-357 被引量:24231
标识
DOI:10.1613/jair.953
摘要

An approach to the construction of classifiers from imbalanced datasets is described. A dataset is imbalanced if the classification categories are not approximately equally represented. Often real-world data sets are predominately composed of "normal" examples with only a small percentage of "abnormal" or "interesting" examples. It is also the case that the cost of misclassifying an abnormal (interesting) example as a normal example is often much higher than the cost of the reverse error. Under-sampling of the majority (normal) class has been proposed as a good means of increasing the sensitivity of a classifier to the minority class. This paper shows that a combination of our method of over-sampling the minority (abnormal) class and under-sampling the majority (normal) class can achieve better classifier performance (in ROC space) than only under-sampling the majority class. This paper also shows that a combination of our method of over-sampling the minority class and under-sampling the majority class can achieve better classifier performance (in ROC space) than varying the loss ratios in Ripper or class priors in Naive Bayes. Our method of over-sampling the minority class involves creating synthetic minority class examples. Experiments are performed using C4.5, Ripper and a Naive Bayes classifier. The method is evaluated using the area under the Receiver Operating Characteristic curve (AUC) and the ROC convex hull strategy.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
如烈火如止水完成签到,获得积分10
7秒前
17秒前
siqilinwillbephd完成签到 ,获得积分10
1分钟前
西扬发布了新的文献求助10
1分钟前
小蛮样完成签到,获得积分10
2分钟前
wykion完成签到,获得积分0
2分钟前
西扬完成签到,获得积分10
2分钟前
2分钟前
2分钟前
年鱼精完成签到 ,获得积分10
3分钟前
文职干部完成签到,获得积分20
3分钟前
3分钟前
3分钟前
文职干部发布了新的文献求助30
3分钟前
PeilunLi发布了新的文献求助30
4分钟前
皮肤科应助PeilunLi采纳,获得30
4分钟前
4分钟前
老林还年轻完成签到,获得积分10
4分钟前
4分钟前
4分钟前
5分钟前
斯寜应助科研通管家采纳,获得10
5分钟前
斯文墨镜完成签到,获得积分20
5分钟前
5分钟前
RunK完成签到,获得积分10
5分钟前
Gman发布了新的文献求助10
6分钟前
RunK发布了新的文献求助10
6分钟前
土豆淀粉完成签到 ,获得积分10
6分钟前
香蕉觅云应助优美的冥幽采纳,获得10
6分钟前
HIKAWA完成签到,获得积分10
6分钟前
ding应助HIKAWA采纳,获得10
6分钟前
熊子文完成签到 ,获得积分10
6分钟前
小奋青完成签到 ,获得积分10
7分钟前
Gman完成签到,获得积分20
7分钟前
orixero应助科研通管家采纳,获得10
7分钟前
科研通AI2S应助科研通管家采纳,获得10
7分钟前
斯寜应助科研通管家采纳,获得10
7分钟前
科研通AI5应助科研通管家采纳,获得10
7分钟前
7分钟前
乐乐应助Gman采纳,获得10
7分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 1500
Izeltabart tapatansine - AdisInsight 800
Maneuvering of a Damaged Navy Combatant 650
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3773657
求助须知:如何正确求助?哪些是违规求助? 3319141
关于积分的说明 10193301
捐赠科研通 3033802
什么是DOI,文献DOI怎么找? 1664714
邀请新用户注册赠送积分活动 796270
科研通“疑难数据库(出版商)”最低求助积分说明 757416