Finite-Time Analysis of Decentralized Stochastic Approximation with Applications in Multi-Agent and Multi-Task Learning

强化学习 计算机科学 随机逼近 马尔可夫链 马尔可夫过程 操作员(生物学) 数学优化 迭代函数 随机过程 独立性(概率论) 趋同(经济学) 多智能体系统 人工智能 数学 机器学习 钥匙(锁) 数学分析 生物化学 统计 化学 计算机安全 抑制因子 转录因子 基因 经济 经济增长
作者
Sihan Zeng,Thinh T. Doan,Justin Romberg
标识
DOI:10.1109/cdc45484.2021.9683363
摘要

Stochastic approximation, a data-driven approach for finding the root of an unknown operator, provides a unified framework for solving many problems in stochastic optimization and reinforcement learning. Motivated by a growing interest in multi-agent and multi-task learning, we study a decentralized variant of stochastic approximation over a network of agents, where the goal is to find the root of the aggregate of the local operators at the agents. In this method, each agent implements a local stochastic approximation using noisy samples from its operator while averaging its iterates with the ones received from its neighbors. Our main contribution is to provide a finite-time analysis of the decentralized stochastic approximation method and to characterize the impacts of the underlying communication topology between agents. Our model for the data observed at each agent is that it is sampled from a Markov process; this lack of independence makes the iterates biased and (potentially) unbounded. Under mild assumptions we show that the convergence rate of the proposed method is essentially the same as if the samples were independent, differing only by a log factor that represents the mixing time of the Markov process. Finally, we present applications of the proposed method on a number of interesting learning problems in multi-agent systems, including distributed robust system identification and decentralized Q-learning for solving multitask reinforcement learning.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
司念者你完成签到 ,获得积分10
1秒前
Akim应助zxs采纳,获得10
1秒前
adagio完成签到,获得积分10
1秒前
lanheqingniao完成签到,获得积分10
1秒前
3秒前
乐观的忆枫完成签到,获得积分10
4秒前
bbd完成签到,获得积分10
4秒前
酷波er应助学术小子采纳,获得10
4秒前
缓慢的王完成签到,获得积分10
6秒前
镕臻完成签到,获得积分10
7秒前
lxdfrank完成签到,获得积分10
7秒前
7秒前
Stuki完成签到,获得积分10
8秒前
乘风破浪完成签到,获得积分10
8秒前
杨丽完成签到,获得积分10
8秒前
felix驳回了传奇3应助
8秒前
8秒前
9秒前
麦可完成签到,获得积分10
9秒前
量子星尘发布了新的文献求助10
9秒前
末末完成签到 ,获得积分10
11秒前
喵喵苗完成签到 ,获得积分10
11秒前
科研通AI2S应助萧狗子采纳,获得10
12秒前
王一鸣完成签到 ,获得积分10
13秒前
砚木完成签到 ,获得积分10
13秒前
Jasper应助可靠月亮采纳,获得10
13秒前
浪子完成签到,获得积分10
13秒前
zxs发布了新的文献求助10
14秒前
乐乐应助小杨同学采纳,获得10
16秒前
villanelle0308完成签到,获得积分10
16秒前
17秒前
大枣儿完成签到,获得积分10
19秒前
如意完成签到,获得积分10
20秒前
缺缺完成签到,获得积分10
20秒前
nanjianli完成签到,获得积分10
20秒前
Ava应助Stuki采纳,获得10
21秒前
21秒前
量子星尘发布了新的文献求助10
22秒前
幽默的老师完成签到,获得积分10
22秒前
徐yy完成签到 ,获得积分10
23秒前
高分求助中
Aerospace Standards Index - 2025 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Clinical Microbiology Procedures Handbook, Multi-Volume, 5th Edition 1000
Teaching Language in Context (Third Edition) 1000
List of 1,091 Public Pension Profiles by Region 961
流动的新传统主义与新生代农民工的劳动力再生产模式变迁 500
Historical Dictionary of British Intelligence (2014 / 2nd EDITION!) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5450513
求助须知:如何正确求助?哪些是违规求助? 4558271
关于积分的说明 14265898
捐赠科研通 4481797
什么是DOI,文献DOI怎么找? 2454981
邀请新用户注册赠送积分活动 1445752
关于科研通互助平台的介绍 1421891