已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

KNNOR: An oversampling technique for imbalanced datasets

过采样 计算机科学 人工智能 Python(编程语言) 机器学习 噪音(视频) 班级(哲学) 数据挖掘 合成数据 人口 测距 分类器(UML) 模式识别(心理学) 算法 带宽(计算) 图像(数学) 社会学 人口学 操作系统 电信 计算机网络
作者
Ashhadul Islam,Samir Brahim Belhaouari,Atiq Ur Rehman,Halima Bensmail
出处
期刊:Applied Soft Computing [Elsevier]
卷期号:115: 108288-108288 被引量:92
标识
DOI:10.1016/j.asoc.2021.108288
摘要

Predictive performance of Machine Learning (ML) models rely on the quality of data used for training the models. However, if the training data is not balanced among different classes, the performance of ML models deteriorate heavily. Several techniques have been proposed in the literature to add some semblance of balance to the data sets by adding artificial data points. Synthetic Minority Oversampling Technique(SMOTE) and Adaptive Synthetic Sampling(ADASYN) are some of the commonly used techniques to deal with class imbalance. However, these approaches are prone to 'within class imbalance' and 'small disjunct problem'. To overcome these problems, this article proposes an advanced algorithm by studying the compactness and location of the minority class relative to other classes. The proposed technique called K-Nearest Neighbor OveRsampling approach (KNNOR) performs a three step process to identify the critical and safe areas for augmentation and generate synthetic data points of the minority class. The relative density of the entire population is considered while generating artificial points. This enables the proposed KNNOR approach to oversample the minority class more reliably and at the same time stay resilient against noise. The proposed method is compared with the ten top performing contemporary oversamplers by testing the accuracy of classifiers trained on augmented data provided by each oversampler. The experimental results on several common imbalanced datasets show that our method ranks first more consistently than the other state-of-art oversamplers. The proposed method is easy to use and has been made open source as a python library.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Dongfu_FA完成签到,获得积分10
1秒前
TUTU发布了新的文献求助10
1秒前
3秒前
3秒前
3秒前
Dongfu_FA发布了新的文献求助10
4秒前
乐乐应助科研通管家采纳,获得10
4秒前
4秒前
4秒前
Jasper应助科研通管家采纳,获得10
4秒前
星辰大海应助科研通管家采纳,获得10
4秒前
6秒前
李米发布了新的文献求助10
10秒前
思川发布了新的文献求助10
11秒前
kean1943完成签到,获得积分10
13秒前
民咕咕嘎完成签到 ,获得积分10
14秒前
我是老大应助耳东采纳,获得10
15秒前
学术咸鱼发布了新的文献求助10
15秒前
Heyley完成签到,获得积分10
16秒前
北风完成签到,获得积分10
19秒前
李米完成签到,获得积分10
20秒前
21秒前
dengqin完成签到 ,获得积分10
23秒前
yyz关闭了yyz文献求助
24秒前
耳东发布了新的文献求助10
26秒前
卡卡西的猫完成签到 ,获得积分10
27秒前
鬼笔环肽完成签到 ,获得积分10
28秒前
靓丽战斗机完成签到 ,获得积分10
30秒前
31秒前
吉吉国王的跟班完成签到 ,获得积分10
33秒前
坦率的语芙完成签到,获得积分10
36秒前
37秒前
慕青应助吃甘薯的小白采纳,获得10
37秒前
38秒前
慕青应助不想起床采纳,获得10
40秒前
Orange应助LIZHEN采纳,获得10
40秒前
小蘑菇应助思川采纳,获得10
40秒前
科研通AI6.1应助思川采纳,获得10
40秒前
炸薯条发布了新的文献求助10
41秒前
mumuuuuya发布了新的文献求助10
43秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 2000
The Social Psychology of Citizenship 1000
Streptostylie bei Dinosauriern nebst Bemerkungen über die 540
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Brittle Fracture in Welded Ships 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5920519
求助须知:如何正确求助?哪些是违规求助? 6902602
关于积分的说明 15813777
捐赠科研通 5047464
什么是DOI,文献DOI怎么找? 2716198
邀请新用户注册赠送积分活动 1669557
关于科研通互助平台的介绍 1606645