Comparison of Sampling Methods for Imbalanced Data Classification in Random Forest

随机森林 人工智能 计算机科学 班级(哲学) 集成学习 决策树 机器学习 采样(信号处理) 模式识别(心理学) 统计分类 一级分类 数据挖掘 上下文图像分类 过采样 支持向量机 图像(数学) 滤波器(信号处理) 计算机视觉 计算机网络 带宽(计算)
作者
May Phu Paing,Chuchart Pintavirooj,S. Tungjitkusolmun,Somsak Choomchuay,Kazuhiko Hamamoto
标识
DOI:10.1109/bmeicon.2018.8609946
摘要

Imbalanced data classification is a serious and challenging task for most of the medical image diagnosis applications. They usually produce a larger number of false samples compared to the actual ones. That is the number of samples for the class of interest (minority) is significantly fewer than other types of class (majority). The classification performed using such data is called imbalanced data classification. As a consequence, the learning model bias towards the majority class and fails the classification of the minority class. Data sampling and ensemble methods are common ways to compensate for this issue. Random forest (RF), an ensemble of multiple decision trees, is very famous in both of the classification and regression problems because of its robust and accurate predictions. However, it also suffers class bias in the imbalanced data classification problems. This paper proposes and compares different sampling methods to solve the imbalanced data classification in RF.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
搜集达人应助mczhu采纳,获得10
刚刚
刚刚
2秒前
XueXiTong完成签到,获得积分10
3秒前
ATYS完成签到,获得积分10
3秒前
万能图书馆应助曾斯诺采纳,获得10
3秒前
ccc完成签到 ,获得积分10
3秒前
斯文败类应助贝贝采纳,获得10
4秒前
奋斗千秋发布了新的文献求助10
4秒前
6秒前
BERT完成签到,获得积分10
8秒前
wind2631完成签到,获得积分10
8秒前
9秒前
绫小路完成签到 ,获得积分10
9秒前
carbonhan完成签到,获得积分0
10秒前
魏凯源发布了新的文献求助10
10秒前
上官若男应助拓跋箴采纳,获得10
11秒前
11秒前
西西完成签到,获得积分10
12秒前
12秒前
嗯enene完成签到,获得积分20
12秒前
852应助笑点低的晓亦采纳,获得10
12秒前
因几完成签到 ,获得积分10
13秒前
会飞的木鱼完成签到,获得积分10
13秒前
善学以致用应助wuhuhu采纳,获得10
14秒前
高不二发布了新的文献求助10
14秒前
16秒前
17秒前
17秒前
但行好事发布了新的文献求助10
17秒前
shJ发布了新的文献求助10
20秒前
mczhu发布了新的文献求助10
20秒前
21秒前
21秒前
LQH完成签到 ,获得积分10
21秒前
科研通AI6.1应助liang采纳,获得10
21秒前
共享精神应助嗯enene采纳,获得10
21秒前
21秒前
研友_VZG7GZ应助科研通管家采纳,获得10
22秒前
Jasper应助科研通管家采纳,获得10
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Picture this! Including first nations fiction picture books in school library collections 1500
Signals, Systems, and Signal Processing 610
Unlocking Chemical Thinking: Reimagining Chemistry Teaching and Learning 555
Photodetectors: From Ultraviolet to Infrared 500
Cancer Targets: Novel Therapies and Emerging Research Directions (Part 1) 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6359264
求助须知:如何正确求助?哪些是违规求助? 8173237
关于积分的说明 17213576
捐赠科研通 5414355
什么是DOI,文献DOI怎么找? 2865433
邀请新用户注册赠送积分活动 1842799
关于科研通互助平台的介绍 1690962