清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Imbalanced data classification: Using transfer learning and active sampling

计算机科学 学习迁移 分类器(UML) 人工智能 机器学习 一般化 传输(计算) 班级(哲学) 数据挖掘 数学 数学分析 并行计算
作者
Yang Liu,Guoping Yang,Shaojie Qiao,Meiqi Liu,Lulu Qu,Nan Han,Tao Wu,Guanming Yuan,Tao Wu,Yuzhong Peng
出处
期刊:Engineering Applications of Artificial Intelligence [Elsevier]
卷期号:117: 105621-105621 被引量:21
标识
DOI:10.1016/j.engappai.2022.105621
摘要

Recently, deep learning models have made great breakthroughs in the field of computer vision, relying on large-scale class-balanced datasets. However, most of them do not consider the class-imbalanced data. In reality, the class-imbalanced distribution can lead to the degradation of model performance, reducing the generalization of these models. In addition, in the era of big data, many applications need to use real-time visual data. These data come from different mobile devices, which continuously generate a huge number of visual data. However, there are few studies using real-time data from information systems, real-time data is easy to capture but difficult to use. In order to solve the above problems, we propose a new model (Transfer Learning Classifier, TLC) based on transfer learning to deal with class-imbalanced data. The model includes active sampling module, real-time data augmentation module and DenseNet module. Among them, (1) the newly proposed active sampling module can dynamically adjust the number of samples with skewed distribution; (2) the data augmentation module can expand the real-time data to avoid over-fitting and insufficient data; (3) the DenseNet module is a standard DenseNet network pre-trained on the ImageNet dataset and transferred to TLC for relearning, and then we adjust the memory usage of the standard DenseNet to make it more efficient. In addition, we have applied a new end-to-end real-time data storage and analysis system. A large number of experiments have been carried out on four different long mantissa data sets. Experimental results show that the proposed TLC model can effectively deal with the static data as well as the real-time data, and the classification effect of imbalanced data is better than that of existing models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
丘比特应助从容栾采纳,获得10
1秒前
蓝色白羊完成签到 ,获得积分10
9秒前
Glory完成签到 ,获得积分10
17秒前
wangye完成签到 ,获得积分10
20秒前
guoxihan完成签到,获得积分10
28秒前
寒战完成签到 ,获得积分10
35秒前
小杨完成签到,获得积分10
36秒前
嫁个养熊猫的完成签到 ,获得积分10
1分钟前
三伏天完成签到,获得积分10
1分钟前
咯咯咯完成签到 ,获得积分10
1分钟前
暮迟途远完成签到,获得积分10
1分钟前
1250241652完成签到,获得积分10
2分钟前
怕孤独的访云完成签到 ,获得积分10
2分钟前
vvvaee完成签到 ,获得积分10
2分钟前
2分钟前
sobergod完成签到 ,获得积分10
2分钟前
自然涵易发布了新的文献求助10
2分钟前
ss发布了新的文献求助10
2分钟前
英姑应助Z颖123采纳,获得10
2分钟前
武汉出血王完成签到,获得积分10
3分钟前
Gary完成签到 ,获得积分10
3分钟前
yinhe完成签到 ,获得积分10
4分钟前
General完成签到 ,获得积分10
4分钟前
5分钟前
打打应助甘楽采纳,获得10
5分钟前
fighting完成签到,获得积分10
5分钟前
fighting发布了新的文献求助10
5分钟前
5分钟前
甘楽发布了新的文献求助10
5分钟前
鬼见愁完成签到,获得积分10
5分钟前
甘楽完成签到,获得积分10
5分钟前
richardzhang1984完成签到 ,获得积分10
5分钟前
6分钟前
Z颖123发布了新的文献求助10
6分钟前
自然涵易完成签到,获得积分10
6分钟前
aniu完成签到,获得积分10
6分钟前
玄黄大世界完成签到,获得积分10
6分钟前
秋夜临完成签到,获得积分10
7分钟前
香蕉觅云应助科研通管家采纳,获得10
7分钟前
emxzemxz完成签到 ,获得积分10
7分钟前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
叶剑英与华南分局档案史料 500
Foreign Policy of the French Second Empire: A Bibliography 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3146832
求助须知:如何正确求助?哪些是违规求助? 2798126
关于积分的说明 7826730
捐赠科研通 2454695
什么是DOI,文献DOI怎么找? 1306428
科研通“疑难数据库(出版商)”最低求助积分说明 627788
版权声明 601565