亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Leverage NLP Models Against Other NLP Models: Two Invisible Feature Space Backdoor Attacks

后门 人工智能 杠杆(统计) 自然语言处理 计算机科学 特征(语言学) 机器学习 哲学 语言学 计算机安全
作者
Xiangjun Li,Xin Lu,Peixuan Li
出处
期刊:IEEE Transactions on Reliability [Institute of Electrical and Electronics Engineers]
卷期号:73 (3): 1559-1568 被引量:1
标识
DOI:10.1109/tr.2024.3375526
摘要

At present, deep neural networks are at risk from backdoor attacks, but natural language processing (NLP) lacks sufficient research on backdoor attacks. To improve the invisibility of backdoor attacks, some innovative textual backdoor attack methods utilize modern language models to generate poisoned text with backdoor triggers, which are called feature space backdoor attacks. However, this article find that texts generated by the same language model without backdoor triggers also have a high probability of activating the backdoors they injected. Therefore, this article proposes a multistyle transfer-based backdoor attack that uses multiple text styles as the backdoor trigger. Furthermore, inspired by the ability of modern language models to distinguish between texts generated by different language models, this article proposes a paraphrase-based backdoor attack, which leverages the shared characteristics of sentences generated by the same paraphrase model as the backdoor trigger. Experiments have been conducted to demonstrate that both backdoor attack methods can be effective against NLP models. More importantly, compared with other feature space backdoor attacks, the poisoned samples generated by paraphrase-based backdoor attacks have improved semantic similarity.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小鸭子完成签到 ,获得积分20
3秒前
斯文的访烟完成签到,获得积分10
4秒前
4秒前
11秒前
摇摆小狗完成签到,获得积分10
13秒前
小文仙丹发布了新的文献求助50
13秒前
14秒前
粽子发布了新的文献求助10
17秒前
思川发布了新的文献求助10
19秒前
mark163完成签到,获得积分10
19秒前
20秒前
25秒前
北渺完成签到,获得积分10
27秒前
科研通AI6.2应助白灼虾采纳,获得10
32秒前
33秒前
34秒前
ss发布了新的文献求助20
35秒前
35秒前
签儿儿儿发布了新的文献求助10
37秒前
40秒前
QIN发布了新的文献求助10
40秒前
龚幻梦发布了新的文献求助10
42秒前
45秒前
隐形太阳发布了新的文献求助10
49秒前
52秒前
思川发布了新的文献求助10
54秒前
白灼虾发布了新的文献求助10
54秒前
留胡子的邑完成签到,获得积分10
57秒前
keth发布了新的文献求助30
58秒前
59秒前
环境恢复完成签到,获得积分10
1分钟前
1分钟前
天天快乐应助HXPHXP采纳,获得10
1分钟前
科研通AI6.2应助思川采纳,获得10
1分钟前
打打应助思川采纳,获得10
1分钟前
FashionBoy应助李博士采纳,获得10
1分钟前
1分钟前
1分钟前
111发布了新的文献求助10
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 2000
The Social Psychology of Citizenship 1000
Streptostylie bei Dinosauriern nebst Bemerkungen über die 540
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Brittle Fracture in Welded Ships 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5920667
求助须知:如何正确求助?哪些是违规求助? 6904459
关于积分的说明 15814033
捐赠科研通 5047631
什么是DOI,文献DOI怎么找? 2716308
邀请新用户注册赠送积分活动 1669691
关于科研通互助平台的介绍 1606694