Comparative Analysis of Oversampling Techniques on Small and Imbalanced Datasets Using Deep Learning

过采样 计算机科学 机器学习 人工智能 班级(哲学) 随机森林 领域(数学) 数据挖掘 统计分类 数学 计算机网络 纯数学 带宽(计算)
作者
Saqib Ul Sabha,Assif Assad,Nusrat Mohi Ud Din,Muzafar Rasool Bhat
标识
DOI:10.1109/aisp57993.2023.10134981
摘要

In imbalanced datasets, certain classes have a larger number of samples compared to others, leading to an unequal distribution of samples across the classes. Since many crucial real-world classification problems, like medical diagnosis, involve imbalanced data, the research community places a high priority on understanding how to use this data. If machine learning is performed directly on the imbalanced data, the disparity between the majority and minority classes will cause bias towards the majority class and lead to inaccurate results. There is growing interest in this field of study, and several algorithms have been created. This study aims to evaluate the effectiveness of five oversampling strategies that are intended to address data imbalance, namely random oversampling, SMOTE, borderline SMOTE, ADASYN, and Deep SMOTE. A comparative analysis is carried out, and the effectiveness of each strategy is examined in terms of evaluation metrics. Experimental results demonstrated that DeepSMOTE outperformed all other oversampling techniques on small and imbalanced datasets.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI6.4应助砚禾采纳,获得80
1秒前
1秒前
111发布了新的文献求助10
4秒前
jia发布了新的文献求助20
4秒前
Ava应助烦烦烦采纳,获得10
4秒前
加油发布了新的文献求助10
5秒前
zk001完成签到,获得积分10
5秒前
5秒前
7秒前
等待完成签到 ,获得积分10
7秒前
7秒前
紫之灵发布了新的文献求助10
8秒前
科目三应助霜双双采纳,获得10
11秒前
12秒前
jia完成签到,获得积分10
12秒前
钨昂汪完成签到,获得积分10
12秒前
12秒前
细心蚂蚁发布了新的文献求助10
13秒前
纯真听安发布了新的文献求助10
13秒前
13秒前
华仔应助超级的藏花采纳,获得10
14秒前
15秒前
陈诗完成签到,获得积分10
15秒前
FashionBoy应助满意的匪采纳,获得10
15秒前
时空路人完成签到,获得积分10
16秒前
sunny完成签到,获得积分10
16秒前
16秒前
孤独夏天完成签到,获得积分10
17秒前
irwazfrd发布了新的文献求助10
17秒前
搜集达人应助123采纳,获得10
17秒前
神勇盼易发布了新的文献求助10
17秒前
18秒前
18秒前
烦烦烦发布了新的文献求助10
18秒前
打打应助细心蚂蚁采纳,获得10
18秒前
19秒前
pzqmoon发布了新的文献求助10
21秒前
21秒前
CodeCraft应助加油采纳,获得10
22秒前
苏苏苏完成签到,获得积分10
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cronologia da história de Macau 5000
Petrology and Plate Tectonics 800
Electrode Potentials 550
Matrix Methods in Data Mining and Pattern Recognition 510
Association of Reentry Well-Being with Psychological Distress, Employment, and Housing Instability 15-Months After Incarceration 500
Trees of tropical Asia : an illustrated guide to diversity 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7030684
求助须知:如何正确求助?哪些是违规求助? 8700349
关于积分的说明 18433423
捐赠科研通 6532740
什么是DOI,文献DOI怎么找? 3112647
关于科研通互助平台的介绍 2191291
邀请新用户注册赠送积分活动 2088142