已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Natural Black-Box Adversarial Examples against Deep Reinforcement Learning

对抗制 强化学习 黑匣子 计算机科学 人工智能 可转让性 深度学习 财产(哲学) 机器学习 认识论 哲学 罗伊特
作者
Mengran Yu,Shiliang Sun
出处
期刊:Proceedings of the ... AAAI Conference on Artificial Intelligence [Association for the Advancement of Artificial Intelligence (AAAI)]
卷期号:36 (8): 8936-8944 被引量:4
标识
DOI:10.1609/aaai.v36i8.20876
摘要

Black-box attacks in deep reinforcement learning usually retrain substitute policies to mimic behaviors of target policies as well as craft adversarial examples, and attack the target policies with these transferable adversarial examples. However, the transferability of adversarial examples is not always guaranteed. Moreover, current methods of crafting adversarial examples only utilize simple pixel space metrics which neglect semantics in the whole images, and thus generate unnatural adversarial examples. To address these problems, we propose an advRL-GAN framework to directly generate semantically natural adversarial examples in the black-box setting, bypassing the transferability requirement of adversarial examples. It formalizes the black-box attack as a reinforcement learning (RL) agent, which explores natural and aggressive adversarial examples with generative adversarial networks and the feedback of target agents. To the best of our knowledge, it is the first RL-based adversarial attack on a deep RL agent. Experimental results on multiple environments demonstrate the effectiveness of advRL-GAN in terms of reward reductions and magnitudes of perturbations, and validate the sparse and targeted property of adversarial perturbations through visualization.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
一只小羊发布了新的文献求助10
刚刚
holmes完成签到 ,获得积分10
1秒前
3秒前
丘比特应助星星采纳,获得10
3秒前
顾矜应助王羲之采纳,获得10
3秒前
VDC应助科研通管家采纳,获得80
5秒前
顾矜应助科研通管家采纳,获得10
5秒前
领导范儿应助科研通管家采纳,获得10
5秒前
深情安青应助gigadrill采纳,获得10
5秒前
Jasper应助科研通管家采纳,获得10
5秒前
5秒前
Jasper应助热塑性哈士奇采纳,获得10
5秒前
赫灵竹完成签到,获得积分10
8秒前
852应助宿素采纳,获得10
8秒前
黄卡卡发布了新的文献求助10
8秒前
所所应助谨慎的向南采纳,获得10
12秒前
大胆的渊思完成签到 ,获得积分10
15秒前
16秒前
豪豪完成签到,获得积分10
16秒前
Bokuto完成签到 ,获得积分20
19秒前
19秒前
21秒前
21秒前
认真书竹完成签到 ,获得积分10
22秒前
23秒前
汉堡包应助susie采纳,获得10
24秒前
大个应助软耳兔的信箱采纳,获得10
24秒前
英俊的铭应助waa采纳,获得10
26秒前
王羲之发布了新的文献求助10
26秒前
ll完成签到,获得积分10
31秒前
39秒前
Lang777完成签到 ,获得积分10
40秒前
嗯嗯发布了新的文献求助10
40秒前
41秒前
41秒前
卡恩完成签到 ,获得积分10
41秒前
光脚小妖完成签到,获得积分10
42秒前
42秒前
qh5706发布了新的文献求助10
42秒前
43秒前
高分求助中
Востребованный временем 2500
Les Mantodea de Guyane 1000
Very-high-order BVD Schemes Using β-variable THINC Method 930
Field Guide to Insects of South Africa 660
The Three Stars Each: The Astrolabes and Related Texts 500
effects of intravenous lidocaine on postoperative pain and gastrointestinal function recovery following gastrointestinal surgery: a meta-analysis 400
The Collected Works of Jeremy Bentham: Rights, Representation, and Reform: Nonsense upon Stilts and Other Writings on the French Revolution 320
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3384170
求助须知:如何正确求助?哪些是违规求助? 2998213
关于积分的说明 8777863
捐赠科研通 2683848
什么是DOI,文献DOI怎么找? 1469877
科研通“疑难数据库(出版商)”最低求助积分说明 679572
邀请新用户注册赠送积分活动 671868