已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Equalization ensemble for large scale highly imbalanced data classification

计算机科学 分类器(UML) 数据挖掘 机器学习 人工智能 基础(拓扑) 比例(比率) 班级(哲学) 集合(抽象数据类型) 采样(信号处理) 随机子空间法 集成学习 模式识别(心理学) 数学 滤波器(信号处理) 数学分析 物理 量子力学 计算机视觉 程序设计语言
作者
Jinjun Ren,Yuping Wang,Mingqian Mao,Yiu‐ming Cheung
出处
期刊:Knowledge Based Systems [Elsevier]
卷期号:242: 108295-108295 被引量:31
标识
DOI:10.1016/j.knosys.2022.108295
摘要

The class-imbalance problem has been widely distributed in various research fields. The larger the data scale and the higher the data imbalance, the more difficult the proper classification. For large-scale highly imbalanced data sets, the ensemble method based on under-sampling is one of the most competitive techniques among the existing techniques. However, it is susceptible to improperly sampling strategies, easy to lose the useful information of the majority class, and not easy to generalize the learning model. To overcome these limitations, we propose an equalization ensemble method (EASE) with two new schemes. First, we propose an equalization under-sampling scheme to generate a balanced data set for each base classifier, which can reduce the impact of class imbalance on the base classifiers; Second, we design a weighted integration scheme, where the G-mean scores obtained by base classifiers on the original imbalanced data set are used as the weights. These weights can not only make the better-performed base-classifiers dominate the final classification decision, but also adapt to a variety of imbalanced data sets with different scales while avoiding the occurrence of some extremely bad situations. Experimental results on three metrics show that EASE increases the diversity of base classifiers and outperforms twelve state-of-the-art methods on the imbalanced data sets with different scales.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
冉冉升起应助科研通管家采纳,获得10
1秒前
完美世界应助科研通管家采纳,获得10
1秒前
领导范儿应助科研通管家采纳,获得10
1秒前
无花果应助科研通管家采纳,获得10
1秒前
Criminology34应助科研通管家采纳,获得10
1秒前
1秒前
水草帽完成签到 ,获得积分10
5秒前
yxh发布了新的文献求助10
6秒前
莫问题完成签到,获得积分20
7秒前
8秒前
积极凌兰完成签到 ,获得积分10
8秒前
Henvy完成签到,获得积分10
8秒前
10秒前
10秒前
皮凡发布了新的文献求助10
14秒前
15秒前
机灵纸鹤完成签到 ,获得积分10
15秒前
arno2233发布了新的文献求助10
17秒前
莫欣宇完成签到 ,获得积分10
18秒前
hhh完成签到 ,获得积分10
18秒前
GingerF举报sun求助涉嫌违规
19秒前
gkads举报zhangxia求助涉嫌违规
19秒前
21秒前
21秒前
21秒前
牙膏616完成签到,获得积分10
21秒前
耶格尔完成签到 ,获得积分10
21秒前
nolan完成签到 ,获得积分10
21秒前
Splaink完成签到 ,获得积分10
24秒前
25秒前
嘿嘿完成签到,获得积分10
25秒前
leyellows完成签到 ,获得积分10
26秒前
天真的迎天完成签到,获得积分10
27秒前
佳怡发布了新的文献求助10
27秒前
科研通AI6应助闪闪的炳采纳,获得10
28秒前
白米发布了新的文献求助10
29秒前
香菜包完成签到,获得积分10
31秒前
Augustines完成签到,获得积分10
31秒前
pinklay完成签到 ,获得积分10
32秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Bandwidth Choice for Bias Estimators in Dynamic Nonlinear Panel Models 2000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
Constitutional and Administrative Law 1000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
Vertebrate Palaeontology, 5th Edition 530
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5356235
求助须知:如何正确求助?哪些是违规求助? 4488073
关于积分的说明 13971611
捐赠科研通 4388906
什么是DOI,文献DOI怎么找? 2411290
邀请新用户注册赠送积分活动 1403833
关于科研通互助平台的介绍 1377655