An improved generative adversarial network to oversample imbalanced datasets

鉴别器 计算机科学 过采样 水准点(测量) 残余物 人工智能 模式识别(心理学) 约束(计算机辅助设计) 采样(信号处理) 算法 数据挖掘 机器学习 探测器 数学 计算机网络 电信 几何学 大地测量学 带宽(计算) 地理
作者
Tingting Pan,Witold Pedrycz,Jie Yang,Jian Wang
出处
期刊:Engineering Applications of Artificial Intelligence [Elsevier]
卷期号:132: 107934-107934 被引量:4
标识
DOI:10.1016/j.engappai.2024.107934
摘要

Many oversampling methods applied to imbalanced data generate samples according to local density distribution of minority samples. However, samples generated by these methods can only present a non-deterministic relationship between the local and global distributions. A generative adversarial network (GAN) is a suitable tool to learn an unknown global probability distribution. In this paper, we propose an improved GAN (I-GAN) to oversample according to the global underlying structure of minority samples. The originality of I-GAN stems from the fact it provides additional density distribution information of minority samples for GAN and generated samples. By building on this idea, three detailed strategies are presented: input random vectors of the generator are sampled from a rough estimate of the distribution of minority samples to orientate fake samples more believable; a residual about minority samples is added into the discriminator to strengthen the constraint of loss function; generated samples are redistributed with a reshaper. These three strategies provide innovative methodologies at various stages of GANs for the oversampling task. Compared with 22 classical and popular imbalanced sampling methods under metrics of Gm, F1, and AUC on 24 benchmark imbalanced datasets, it is shown that I-GAN is effective and robust. The I-GAN implementation line procedure has been uploaded to Github (https://github.com/flowerbloom000/I-GAN).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
KK发布了新的文献求助10
1秒前
852应助朱大大666采纳,获得30
1秒前
精明的寒天完成签到,获得积分10
4秒前
含蓄的孤丝完成签到,获得积分10
4秒前
5秒前
5秒前
6秒前
8秒前
9秒前
早安发布了新的文献求助10
9秒前
唐帅发布了新的文献求助10
10秒前
10秒前
hou发布了新的文献求助10
10秒前
11秒前
Yumi完成签到,获得积分10
12秒前
务实大神发布了新的文献求助10
13秒前
bjyxszd发布了新的文献求助10
13秒前
大知闲闲发布了新的文献求助10
16秒前
20秒前
唐帅完成签到,获得积分10
21秒前
龙在天涯完成签到,获得积分0
22秒前
am完成签到,获得积分10
22秒前
笨笨芝麻完成签到,获得积分10
23秒前
23秒前
儒雅的小懒虫完成签到 ,获得积分10
23秒前
李健的小迷弟应助volunteer采纳,获得10
24秒前
生活不是电影完成签到,获得积分10
24秒前
桐桐应助liuzengzhang666采纳,获得10
27秒前
浮游应助993采纳,获得10
27秒前
Beacon发布了新的文献求助10
28秒前
28秒前
城123完成签到,获得积分20
29秒前
纪予舟完成签到 ,获得积分10
30秒前
李爱国应助25_1采纳,获得10
32秒前
知性的夏槐完成签到 ,获得积分10
36秒前
36秒前
khurram完成签到,获得积分10
37秒前
38秒前
39秒前
40秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
Constitutional and Administrative Law 1000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Corrosion and corrosion control 500
Die Fliegen der Palaearktischen Region. Familie 64 g: Larvaevorinae (Tachininae). 1975 500
The Experimental Biology of Bryophytes 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5373831
求助须知:如何正确求助?哪些是违规求助? 4499875
关于积分的说明 14007415
捐赠科研通 4406786
什么是DOI,文献DOI怎么找? 2420717
邀请新用户注册赠送积分活动 1413451
关于科研通互助平台的介绍 1390059