Byzantine-Resilient Decentralized Policy Evaluation With Linear Function Approximation

稳健性(进化) 强化学习 计算机科学 收敛速度 拜占庭式建筑 数学优化 功能(生物学) 兰姆达 趋同(经济学) 数学 人工智能 计算机网络 基因 历史 光学 物理 生物 频道(广播) 进化生物学 经济 化学 古代史 生物化学 经济增长
作者
Zhaoxian Wu,Han Shen,Tianyi Chen,Qing Ling
出处
期刊:IEEE Transactions on Signal Processing [Institute of Electrical and Electronics Engineers]
卷期号:69: 3839-3853 被引量:12
标识
DOI:10.1109/tsp.2021.3090952
摘要

This paper considers the policy evaluation problem in a multi-agent reinforcement learning (MARL) environment over decentralized and directed networks. The focus is on decentralized temporal difference (TD) learning with linear function approximation in the presence of unreliable or even malicious agents, termed as Byzantine agents. In order to evaluate the quality of a fixed policy in a common environment, agents usually run decentralized TD($\lambda$) collaboratively. However, when some Byzantine agents behave adversarially, decentralized TD($\lambda$) is unable to learn an accurate linear approximation for the true value function. We propose a trimmed-mean based Byzantine-resilient decentralized TD($\lambda$) algorithm to perform policy evaluation in this setting. We establish the finite-time convergence rate, as well as the asymptotic learning error in the presence of Byzantine agents. Numerical experiments corroborate the robustness of the proposed algorithm.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
SCISSH完成签到 ,获得积分10
刚刚
YuF发布了新的文献求助10
刚刚
正直的梦龙应助Charis采纳,获得10
刚刚
2秒前
刘cl发布了新的文献求助10
3秒前
6秒前
6秒前
6秒前
9秒前
meina发布了新的文献求助10
9秒前
青梅发布了新的文献求助20
11秒前
灶强发布了新的文献求助30
11秒前
11秒前
科目三应助善良耳机采纳,获得10
12秒前
李健应助insane采纳,获得10
12秒前
Sunian应助坚持就是胜利采纳,获得30
12秒前
13秒前
13秒前
CherH发布了新的文献求助10
14秒前
14秒前
调研昵称发布了新的文献求助10
15秒前
Singularity应助苦海采纳,获得10
16秒前
Hosea发布了新的文献求助10
17秒前
18秒前
打打应助失眠的数据线采纳,获得10
19秒前
Jasper应助科研靓仔采纳,获得10
20秒前
20秒前
健忘数据线完成签到 ,获得积分10
22秒前
Chemistry发布了新的文献求助10
23秒前
23秒前
23秒前
24秒前
斯文败类应助123采纳,获得10
25秒前
傅英俊完成签到,获得积分10
26秒前
Z1070741749发布了新的文献求助10
26秒前
星辰大海应助CherH采纳,获得10
27秒前
27秒前
田田发布了新的文献求助10
28秒前
小白狗发布了新的文献求助10
28秒前
0000完成签到 ,获得积分10
29秒前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1500
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
The Oxford Handbook of Educational Psychology 600
有EBL数据库的大佬进 Matrix Mathematics 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 遗传学 化学工程 基因 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3412724
求助须知:如何正确求助?哪些是违规求助? 3015318
关于积分的说明 8869744
捐赠科研通 2703064
什么是DOI,文献DOI怎么找? 1482010
科研通“疑难数据库(出版商)”最低求助积分说明 685108
邀请新用户注册赠送积分活动 679781