Assessing the Effectiveness of Oversampling and Undersampling Techniques for Intrusion Detection on an Imbalanced Dataset

欠采样 过采样 计算机科学 入侵检测系统 班级(哲学) 随机森林 人工智能 机器学习 数据挖掘 统计 数学 带宽(计算) 计算机网络
作者
Fayruz Rahma,Reza Fuad Rachmadi,Baskoro Adi Pratomo,Mauridhi Hery Purnomo
标识
DOI:10.1109/ieacon57683.2023.10370430
摘要

The imbalanced class distribution in intrusion detection systems has been a significant issue. Imbalanced class distribution can negatively impact the performance of intrusion detection systems as they may be biased towards the majority class. We explore the effectiveness of oversampling and under-sampling techniques to address this issue. Oversampling and undersampling techniques aim to balance the class distribution and improve the performance of the intrusion detection system. Oversampling increases the number of records in the minority class to make it closer in size to the majority class. Conversely, undersampling reduces the number of records in the majority class so that it is closer in size to the minority class. We assess the effectiveness of different oversampling and undersampling techniques, including Random OverSampling, SMOTE, ADASYN, Random UnderSampling, AllKNN, TomekLinks, SMOTEENN, and SMOTETomek. The experiment's findings indicate that the raw data achieved the highest accuracy score, 0.965. On the other hand, the Random Oversampling method yielded the highest F1 score, reaching a score of 0.589. When we see the evaluation scores of each class, the recall & F1 scores generally show high contrast between classes with a large amount of data and classes with (previously) a small amount of data, even though the data for training has been more balanced. We found that oversampling and undersampling can improve the performance of intrusion detection systems in specific ways, but this still needs improvement. These results can serve as a reference for researchers developing intrusion detection systems.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
pphss完成签到,获得积分10
12秒前
vassallo完成签到 ,获得积分10
12秒前
zhangr完成签到 ,获得积分10
14秒前
殷勤的紫槐完成签到,获得积分10
18秒前
WW完成签到 ,获得积分10
20秒前
22秒前
unowhoiam完成签到 ,获得积分10
25秒前
zhaoyang完成签到 ,获得积分10
28秒前
不会游泳的鱼完成签到 ,获得积分10
29秒前
31秒前
姜水完成签到,获得积分10
33秒前
34秒前
wwww完成签到 ,获得积分10
38秒前
TT完成签到 ,获得积分10
40秒前
46秒前
hy1234完成签到 ,获得积分10
47秒前
琦qi完成签到 ,获得积分10
49秒前
三更笔舞发布了新的文献求助30
51秒前
赘婿应助科研通管家采纳,获得10
53秒前
贰鸟应助科研通管家采纳,获得20
53秒前
zz完成签到,获得积分10
54秒前
YZJing完成签到,获得积分10
54秒前
al完成签到 ,获得积分10
56秒前
Ivan完成签到 ,获得积分10
1分钟前
陌子完成签到 ,获得积分10
1分钟前
牛拉犁完成签到 ,获得积分10
1分钟前
夏秋完成签到 ,获得积分10
1分钟前
mike2012完成签到 ,获得积分10
1分钟前
大大蕾完成签到 ,获得积分10
1分钟前
七月星河完成签到 ,获得积分10
1分钟前
小肉球完成签到 ,获得积分10
1分钟前
认真以云完成签到 ,获得积分10
1分钟前
开心完成签到 ,获得积分10
1分钟前
多克特里完成签到 ,获得积分10
1分钟前
wefor完成签到 ,获得积分10
1分钟前
柒月完成签到 ,获得积分10
1分钟前
叁叁完成签到 ,获得积分10
1分钟前
狗子爱吃桃桃完成签到 ,获得积分10
1分钟前
btcat完成签到,获得积分10
1分钟前
DocZhao完成签到 ,获得积分10
1分钟前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
An Introduction to Geographical and Urban Economics: A Spiky World Book by Charles van Marrewijk, Harry Garretsen, and Steven Brakman 500
Diagnostic immunohistochemistry : theranostic and genomic applications 6th Edition 500
Chen Hansheng: China’s Last Romantic Revolutionary 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3150630
求助须知:如何正确求助?哪些是违规求助? 2802177
关于积分的说明 7846164
捐赠科研通 2459431
什么是DOI,文献DOI怎么找? 1309256
科研通“疑难数据库(出版商)”最低求助积分说明 628793
版权声明 601757