Generative Oversampling Methods for Handling Imbalanced Data in Software Fault Prediction

过采样 机器学习 计算机科学 断层(地质) 人工智能 软件 数据挖掘 班级(哲学) 软件错误 计算机网络 带宽(计算) 地震学 程序设计语言 地质学
作者
Santosh Singh Rathore,Satyendra Singh Chouhan,Dixit Kumar Jain,Aakash Gopal Vachhani
出处
期刊:IEEE Transactions on Reliability [Institute of Electrical and Electronics Engineers]
卷期号:71 (2): 747-762 被引量:25
标识
DOI:10.1109/tr.2022.3158949
摘要

Imbalanced software fault datasets, having fewer faulty modules than the nonfaulty modules, make accurate fault prediction difficult. It is challenging for software practitioners to handle imbalanced fault data during software fault prediction (SFP). Earlier, several researchers have applied oversampling techniques such as synthetic minority oversampling techniques and others for imbalanced learning in SFP. However, most of these techniques resulted in overfitted prediction models. This article presents generative oversampling methods to handle imbalanced data problems in the SFP. Using the generative adversarial network (GAN) based approach, the presented methods generate synthetic samples of the faulty modules to balance the proportion of faulty and nonfaulty modules in the fault datasets. Further, SFP models are built on the processed fault datasets using different machine learning techniques. Experimental validation of the presented oversampling methods is done on 18 fault datasets gathered from PROMISE, JIRA, Eclipse data repositories, and precision, recall, f1-score, and AUC are used as evaluation measures. We extensively compared presented oversampling methods with various state-of-the-art class imbalance techniques and baseline models. The experimental results evidenced that the presented methods improved fault prediction performance and yielded better performance than the state-of-the-art class imbalance techniques.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
啦啦啦啦啦啦啦完成签到,获得积分10
刚刚
刚刚
呓语完成签到,获得积分10
1秒前
上官若男应助csy采纳,获得10
1秒前
可爱的雨柏完成签到,获得积分10
2秒前
蛙趣完成签到,获得积分10
2秒前
2秒前
果果完成签到,获得积分10
2秒前
yanwowo完成签到,获得积分10
2秒前
3秒前
星星完成签到,获得积分10
3秒前
3秒前
laojian完成签到 ,获得积分10
3秒前
李健应助深情傲柔采纳,获得10
4秒前
栓Q发布了新的文献求助10
4秒前
4秒前
CT民工发布了新的文献求助10
4秒前
mslln发布了新的文献求助10
4秒前
科研完成签到,获得积分20
5秒前
6秒前
PGZ完成签到,获得积分10
6秒前
醒醒完成签到,获得积分10
6秒前
赘婿应助ing采纳,获得10
7秒前
zhou完成签到,获得积分10
8秒前
量子星尘发布了新的文献求助10
8秒前
周晓发布了新的文献求助10
8秒前
beyond完成签到,获得积分10
9秒前
9秒前
做饭不咸完成签到,获得积分10
10秒前
无极微光应助木光采纳,获得20
10秒前
11秒前
www发布了新的文献求助10
11秒前
万能图书馆应助yanwowo采纳,获得10
11秒前
黄嘉慧完成签到 ,获得积分10
12秒前
想发一篇贾克斯完成签到,获得积分10
12秒前
13秒前
F_ken发布了新的文献求助10
13秒前
块块的加隆满口袋完成签到 ,获得积分10
14秒前
CT民工发布了新的文献求助10
14秒前
受伤冰菱完成签到,获得积分10
15秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Acute Mountain Sickness 2000
A novel angiographic index for predicting the efficacy of drug-coated balloons in small vessels 500
Textbook of Neonatal Resuscitation ® 500
Thomas Hobbes' Mechanical Conception of Nature 500
The Affinity Designer Manual - Version 2: A Step-by-Step Beginner's Guide 500
Affinity Designer Essentials: A Complete Guide to Vector Art: Your Ultimate Handbook for High-Quality Vector Graphics 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5097313
求助须知:如何正确求助?哪些是违规求助? 4309783
关于积分的说明 13428428
捐赠科研通 4137300
什么是DOI,文献DOI怎么找? 2266533
邀请新用户注册赠送积分活动 1269654
关于科研通互助平台的介绍 1205978