已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

You Are What You Write: Preserving Privacy in the Era of Large Language Models

计算机科学 差别隐私 对抗制 公制(单位) 私人信息检索 信息敏感性 语言模型 个人可识别信息 信息隐私 数据挖掘 机器学习 人工智能 计算机安全 运营管理 经济
作者
Richard E. Plant,Mario Valerio Giuffrida,Dimitra Gkatzia
出处
期刊:Cornell University - arXiv 被引量:4
标识
DOI:10.48550/arxiv.2204.09391
摘要

Large scale adoption of large language models has introduced a new era of convenient knowledge transfer for a slew of natural language processing tasks. However, these models also run the risk of undermining user trust by exposing unwanted information about the data subjects, which may be extracted by a malicious party, e.g. through adversarial attacks. We present an empirical investigation into the extent of the personal information encoded into pre-trained representations by a range of popular models, and we show a positive correlation between the complexity of a model, the amount of data used in pre-training, and data leakage. In this paper, we present the first wide coverage evaluation and comparison of some of the most popular privacy-preserving algorithms, on a large, multi-lingual dataset on sentiment analysis annotated with demographic information (location, age and gender). The results show since larger and more complex models are more prone to leaking private information, use of privacy-preserving methods is highly desirable. We also find that highly privacy-preserving technologies like differential privacy (DP) can have serious model utility effects, which can be ameliorated using hybrid or metric-DP techniques.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
珊瑚蛇关注了科研通微信公众号
5秒前
1234完成签到 ,获得积分10
5秒前
丰富曼青完成签到,获得积分10
8秒前
CodeCraft应助怕孤独的鞋垫采纳,获得10
8秒前
义气幼珊完成签到 ,获得积分10
12秒前
14秒前
阿飞完成签到,获得积分10
15秒前
bkagyin应助Sanqainli采纳,获得10
17秒前
欣慰问凝发布了新的文献求助10
25秒前
夏末完成签到 ,获得积分10
26秒前
DaisyChan完成签到 ,获得积分10
26秒前
rio完成签到 ,获得积分10
26秒前
hsvxvk完成签到 ,获得积分10
28秒前
LuoYR@SZU完成签到,获得积分10
39秒前
在水一方应助keep1997采纳,获得10
42秒前
喵咪西西完成签到 ,获得积分10
43秒前
丰富曼青发布了新的文献求助50
44秒前
追寻紫安应助夏末采纳,获得30
46秒前
48秒前
50秒前
温暖眼神完成签到,获得积分10
51秒前
51秒前
Sanqainli发布了新的文献求助10
53秒前
哭泣的丝完成签到 ,获得积分10
54秒前
晨曦发布了新的文献求助20
56秒前
56秒前
烟花应助科研通管家采纳,获得10
56秒前
FashionBoy应助科研通管家采纳,获得10
56秒前
李健的小迷弟应助zhvjdb采纳,获得10
57秒前
58秒前
Owen应助zz采纳,获得10
59秒前
我是老大应助哈哈Hank采纳,获得10
59秒前
搜集达人应助长欢采纳,获得10
1分钟前
1分钟前
Darcy完成签到,获得积分10
1分钟前
DagrZheng完成签到,获得积分10
1分钟前
鳗鱼雪莲完成签到,获得积分10
1分钟前
希望天下0贩的0应助长欢采纳,获得10
1分钟前
科研通AI2S应助忧虑的羊采纳,获得10
1分钟前
高分求助中
Kinetics of the Esterification Between 2-[(4-hydroxybutoxy)carbonyl] Benzoic Acid with 1,4-Butanediol: Tetrabutyl Orthotitanate as Catalyst 1000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
Rechtsphilosophie 1000
Handbook of Qualitative Cross-Cultural Research Methods 600
Chen Hansheng: China’s Last Romantic Revolutionary 500
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3139400
求助须知:如何正确求助?哪些是违规求助? 2790323
关于积分的说明 7794903
捐赠科研通 2446762
什么是DOI,文献DOI怎么找? 1301366
科研通“疑难数据库(出版商)”最低求助积分说明 626153
版权声明 601141