Revisiting model fairness via adversarial examples

对抗制 计算机科学 歪斜 稳健性(进化) 数学优化 约束(计算机辅助设计) 人工智能 理论计算机科学 数学 几何学 生物化学 电信 基因 化学
作者
Tao Zhang,Tianqing Zhu,Jing Li,Wanlei Zhou,Philip S. Yu
出处
期刊:Knowledge Based Systems [Elsevier BV]
卷期号:277: 110777-110777 被引量:3
标识
DOI:10.1016/j.knosys.2023.110777
摘要

Existing research literally evaluates model fairness over limited observed data. In practice, however, factors such as maliciously crafted examples and naturally corrupted examples often appear in real-world data collection. This severely limits the reliability of bias removal methods, inhibits fairness improvement in long-term learning systems, and probes to study accuracy-related robustness. Therefore, we ask: How adversarial examples will skew model fairness? In this paper, we investigate the vulnerability of individual fairness and group fairness to adversarial attacks. We further propose a general adversarial fairness attack framework capable of twisting model bias through a small subset of adversarial examples. We formulate this problem as an optimization problem: maximizing the model bias with the constraint of the number of adversarial examples and the perturbation scale. Our approach finds the most vulnerable examples to model fairness based on the estimated distance from examples to the decision boundary and demographic information. The experimental results 1 show that model fairness is easily skewed by a small number of adversarial examples.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI2S应助扶雨至姑苏采纳,获得10
刚刚
刚刚
1秒前
1秒前
1秒前
1秒前
1秒前
张雨完成签到,获得积分10
2秒前
小巧的菲鹰完成签到,获得积分20
2秒前
2秒前
赘婿应助C_采纳,获得10
2秒前
嘻嘻嘻完成签到,获得积分10
3秒前
bksw_viycole完成签到,获得积分10
3秒前
隐形曼青应助幸运鱼采纳,获得10
3秒前
kuba完成签到,获得积分10
3秒前
加绒发布了新的文献求助10
3秒前
满意百川发布了新的文献求助10
3秒前
CipherSage应助mensa采纳,获得10
4秒前
乐乐应助zhang采纳,获得10
4秒前
Eurus完成签到,获得积分10
4秒前
movie发布了新的文献求助10
4秒前
哈哈哈哈发布了新的文献求助10
4秒前
4秒前
5秒前
5秒前
5秒前
5秒前
NN完成签到,获得积分20
5秒前
WW发布了新的文献求助10
6秒前
6秒前
6秒前
6秒前
instinct25发布了新的文献求助10
6秒前
欣欣子完成签到,获得积分10
6秒前
bobo发布了新的文献求助10
6秒前
科研不通发布了新的文献求助10
7秒前
安妮发布了新的文献求助10
7秒前
7秒前
8秒前
dde发布了新的文献求助10
8秒前
高分求助中
Inorganic Chemistry Eighth Edition 1200
Standards for Molecular Testing for Red Cell, Platelet, and Neutrophil Antigens, 7th edition 1000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
The Psychological Quest for Meaning 800
Signals, Systems, and Signal Processing 610
脑电大模型与情感脑机接口研究--郑伟龙 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6303451
求助须知:如何正确求助?哪些是违规求助? 8120119
关于积分的说明 17005167
捐赠科研通 5363328
什么是DOI,文献DOI怎么找? 2848493
邀请新用户注册赠送积分活动 1825953
关于科研通互助平台的介绍 1679821