Research and application of XGBoost in imbalanced data

计算机科学 机器学习 支持向量机 采样(信号处理) 人工智能 数据挖掘 数据集 贝叶斯概率 正规化(语言学) 计算机视觉 滤波器(信号处理)
作者
Ping Zhang,Yiqiao Jia,Youlin Shang
出处
期刊:International Journal of Distributed Sensor Networks [SAGE]
卷期号:18 (6): 155013292211069-155013292211069 被引量:71
标识
DOI:10.1177/15501329221106935
摘要

As a new and efficient ensemble learning algorithm, XGBoost has been widely applied for its multitudinous advantages, but its classification effect in the case of data imbalance is often not ideal. Aiming at this problem, an attempt was made to optimize the regularization term of XGBoost, and a classification algorithm based on mixed sampling and ensemble learning is proposed. The main idea is to combine SVM-SMOTE over-sampling and EasyEnsemble under-sampling technologies for data processing, and then obtain the final model based on XGBoost by training and ensemble. At the same time, the optimal parameters are automatically searched and adjusted through the Bayesian optimization algorithm to realize classification prediction. In the experimental stage, the G-mean and area under the curve (AUC) values are used as evaluation indicators to compare and analyze the classification performance of different sampling methods and algorithm models. The experimental results on the public data set also verify the feasibility and effectiveness of the proposed algorithm.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
李爱国应助张文静采纳,获得10
2秒前
3秒前
hs完成签到,获得积分10
3秒前
烟花应助周大琳采纳,获得10
3秒前
swallow发布了新的文献求助10
4秒前
6秒前
8秒前
zho发布了新的文献求助10
10秒前
爆米花应助Sandstorm采纳,获得10
12秒前
舒适以山发布了新的文献求助10
13秒前
15秒前
15秒前
VDC应助Dreamer采纳,获得100
15秒前
shinysparrow应助旧事与九月采纳,获得200
16秒前
16秒前
SciGPT应助失眠的海云采纳,获得10
16秒前
搜集达人应助kls采纳,获得10
18秒前
因一完成签到,获得积分10
20秒前
Tin发布了新的文献求助10
22秒前
海晨发布了新的文献求助10
23秒前
这啥呀完成签到,获得积分10
24秒前
我是老大应助豆⑧采纳,获得10
25秒前
NexusExplorer应助Cope采纳,获得30
25秒前
27秒前
Dreamer完成签到,获得积分10
27秒前
27秒前
28秒前
团团圆圆也应助monkey采纳,获得10
29秒前
kls发布了新的文献求助10
32秒前
鳗鱼雪莲完成签到,获得积分10
33秒前
Jane发布了新的文献求助10
34秒前
打打应助研友_ZAxX6n采纳,获得30
37秒前
蓝蓝的腿毛完成签到 ,获得积分10
37秒前
swallow完成签到,获得积分10
37秒前
37秒前
38秒前
38秒前
周大琳发布了新的文献求助10
42秒前
43秒前
一颗星发布了新的文献求助10
43秒前
高分求助中
进口的时尚——14世纪东方丝绸与意大利艺术 Imported Fashion:Oriental Silks and Italian Arts in the 14th Century 800
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 550
临床微生物检验问与答 (第二版), 人民卫生出版社, 2014:146 500
Green building development for a sustainable environment with artificial intelligence technology 500
Zeitschrift für Orient-Archäologie 500
The Collected Works of Jeremy Bentham: Rights, Representation, and Reform: Nonsense upon Stilts and Other Writings on the French Revolution 320
Med Surg Certification Review Book: 3 Practice Tests and CMSRN Study Guide for the Medical Surgical (RN-BC) Exam [5th Edition] 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3351004
求助须知:如何正确求助?哪些是违规求助? 2976541
关于积分的说明 8675492
捐赠科研通 2657683
什么是DOI,文献DOI怎么找? 1455204
科研通“疑难数据库(出版商)”最低求助积分说明 673751
邀请新用户注册赠送积分活动 664242