已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

From Grim Reality to Practical Solution: Malware Classification in Real-World Noise

计算机科学 机器学习 人工智能 噪音(视频) 莫尔斯电码 恶意软件 标记数据 经济短缺 数据挖掘 图像(数学) 计算机安全 电信 语言学 哲学 政府(语言学)
作者
Xian Wu,Wenbo Guo,Jia Yan,Barış Coşkun,Xinyu Xing
标识
DOI:10.1109/sp46215.2023.10179453
摘要

Malware datasets inevitably contain incorrect labels due to the shortage of expertise and experience needed for sample labeling. Previous research demonstrated that a training dataset with incorrectly labeled samples would result in inaccurate model learning. To address this problem, researchers have proposed various noise learning methods to offset the impact of incorrectly labeled samples, and in image recognition and text mining applications, these methods demonstrated great success. In this work, we apply both representative and state-of-the-art noise learning methods to real-world malware classification tasks. We surprisingly observe that none of the existing methods could minimize incorrect labels' impact. Through a carefully designed experiment, we discover that the inefficacy mainly results from extreme data imbalance and the high percentage of incorrectly labeled data samples. As such, we further propose a new noise learning method and name it after MORSE. Unlike existing methods, MORSE customizes and extends a state-of-the-art semi-supervised learning technique. It takes possibly incorrectly labeled data as unlabeled data and thus avoids their potential negative impact on model learning. In MORSE, we also integrate a sample re-weighting method that balances the training data usage in the model learning and thus handles the data imbalance challenge. We evaluate MORSE on both our synthesized and real-world datasets. We show that MORSE could significantly outperform existing noise learning methods and minimize the impact of incorrectly labeled data.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
妮妮完成签到 ,获得积分10
刚刚
善学以致用应助hbh采纳,获得10
4秒前
Akim应助科研通管家采纳,获得10
7秒前
科研通AI2S应助科研通管家采纳,获得10
7秒前
杳鸢应助科研通管家采纳,获得30
7秒前
LANER完成签到 ,获得积分10
10秒前
13秒前
kento完成签到,获得积分0
21秒前
YYiijj完成签到 ,获得积分10
28秒前
30秒前
所所应助LHS采纳,获得10
33秒前
CC发布了新的文献求助10
35秒前
zoey完成签到 ,获得积分10
36秒前
40秒前
40秒前
禾平完成签到,获得积分10
40秒前
577完成签到,获得积分10
43秒前
禾平发布了新的文献求助10
44秒前
44秒前
失眠的怀柔完成签到 ,获得积分10
45秒前
Christine发布了新的文献求助10
48秒前
竹筏过海应助临江仙采纳,获得30
52秒前
江城一霸完成签到,获得积分10
54秒前
墨言无殇完成签到 ,获得积分10
54秒前
Ava应助CC采纳,获得10
56秒前
桐桐应助无情的如波采纳,获得10
58秒前
Christine完成签到,获得积分10
59秒前
wanci应助33采纳,获得10
1分钟前
1分钟前
1分钟前
整齐的蜻蜓完成签到 ,获得积分10
1分钟前
1分钟前
内向的火车完成签到 ,获得积分10
1分钟前
Joeswith完成签到,获得积分10
1分钟前
倚楼听春雨完成签到 ,获得积分10
1分钟前
年糕菌完成签到,获得积分10
1分钟前
褚青筠发布了新的文献求助10
1分钟前
1分钟前
无花果应助xiaozeze采纳,获得10
1分钟前
倚楼听春雨关注了科研通微信公众号
1分钟前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Cognitive Paradigms in Knowledge Organisation 2000
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger Heßler, Claudia, Rud 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
Natural History of Mantodea 螳螂的自然史 1000
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
How Maoism Was Made: Reconstructing China, 1949-1965 800
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 量子力学 冶金 电极
热门帖子
关注 科研通微信公众号,转发送积分 3316828
求助须知:如何正确求助?哪些是违规求助? 2948681
关于积分的说明 8541698
捐赠科研通 2624564
什么是DOI,文献DOI怎么找? 1436318
科研通“疑难数据库(出版商)”最低求助积分说明 665845
邀请新用户注册赠送积分活动 651792