Jailbreaking ChatGPT via Prompt Engineering: An Empirical Study

计算机科学 心理弹性 钥匙(锁) 抗性(生态学) 数据科学 心理学 计算机安全 社会心理学 生态学 生物
作者
Yi Liu,Gelei Deng,Zhengzi Xu,Yuekang Li,Yaowen Zheng,Ying Zhang,Lida Zhao,Tianwei Zhang,Yang Liu
出处
期刊:Cornell University - arXiv 被引量:58
标识
DOI:10.48550/arxiv.2305.13860
摘要

Large Language Models (LLMs), like ChatGPT, have demonstrated vast potential but also introduce challenges related to content constraints and potential misuse. Our study investigates three key research questions: (1) the number of different prompt types that can jailbreak LLMs, (2) the effectiveness of jailbreak prompts in circumventing LLM constraints, and (3) the resilience of ChatGPT against these jailbreak prompts. Initially, we develop a classification model to analyze the distribution of existing prompts, identifying ten distinct patterns and three categories of jailbreak prompts. Subsequently, we assess the jailbreak capability of prompts with ChatGPT versions 3.5 and 4.0, utilizing a dataset of 3,120 jailbreak questions across eight prohibited scenarios. Finally, we evaluate the resistance of ChatGPT against jailbreak prompts, finding that the prompts can consistently evade the restrictions in 40 use-case scenarios. The study underscores the importance of prompt structures in jailbreaking LLMs and discusses the challenges of robust jailbreak prompt generation and prevention.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
xx发布了新的文献求助30
1秒前
2秒前
摸猫的鱼发布了新的文献求助30
4秒前
5r应助biofresh采纳,获得10
5秒前
丘比特应助沉淀体育生采纳,获得10
6秒前
端庄的访卉完成签到 ,获得积分10
6秒前
黄10086完成签到,获得积分10
6秒前
彭于晏应助流风回雪采纳,获得10
8秒前
lmj565完成签到 ,获得积分10
9秒前
9秒前
派大星发布了新的文献求助10
11秒前
Lyubb完成签到 ,获得积分10
12秒前
阿珂完成签到,获得积分10
12秒前
酷波er应助沈星燃采纳,获得10
12秒前
善学以致用应助Mansis采纳,获得10
13秒前
13秒前
14秒前
Hello应助海风采纳,获得10
14秒前
14秒前
15秒前
wangyr11发布了新的文献求助10
16秒前
17秒前
18秒前
科研通AI2S应助零慧采纳,获得10
19秒前
20秒前
一二完成签到,获得积分10
22秒前
蜡笔小猪完成签到,获得积分10
22秒前
流风回雪完成签到,获得积分10
24秒前
24秒前
25秒前
25秒前
26秒前
蜡笔小猪发布了新的文献求助10
27秒前
思源应助dmsoli采纳,获得30
27秒前
衣裳薄发布了新的文献求助10
29秒前
Mansis发布了新的文献求助10
29秒前
黄10086发布了新的文献求助10
30秒前
31秒前
31秒前
共享精神应助李哥采纳,获得20
34秒前
高分求助中
Востребованный временем 2500
Les Mantodea de Guyane 1000
Very-high-order BVD Schemes Using β-variable THINC Method 970
Field Guide to Insects of South Africa 660
Foucault's Technologies Another Way of Cutting Reality 500
Forensic Chemistry 400
Toward personalized care for insomnia in the US Army: a machine learning model to predict response to cognitive behavioral therapy for insomnia 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3392477
求助须知:如何正确求助?哪些是违规求助? 3003086
关于积分的说明 8807533
捐赠科研通 2689819
什么是DOI,文献DOI怎么找? 1473318
科研通“疑难数据库(出版商)”最低求助积分说明 681547
邀请新用户注册赠送积分活动 674351