PowerGridworld: A Framework for Multi-Agent Reinforcement Learning in Power Systems

强化学习 模块化设计 计算机科学 背景(考古学) 网格 分布式计算 钥匙(锁) 软件 软件框架 人工智能 软件系统 基于构件的软件工程 操作系统 古生物学 几何学 数学 生物
作者
David Biagioni,Xiangyu Zhang,Dylan Wald,Deepthi Vaidhynathan,Rohit Chintala,Jennifer King,Ahmed S. Zamzam
出处
期刊:Cornell University - arXiv 被引量:5
标识
DOI:10.48550/arxiv.2111.05969
摘要

We present the PowerGridworld software package to provide users with a lightweight, modular, and customizable framework for creating power-systems-focused, multi-agent Gym environments that readily integrate with existing training frameworks for reinforcement learning (RL). Although many frameworks exist for training multi-agent RL (MARL) policies, none can rapidly prototype and develop the environments themselves, especially in the context of heterogeneous (composite, multi-device) power systems where power flow solutions are required to define grid-level variables and costs. PowerGridworld is an open-source software package that helps to fill this gap. To highlight PowerGridworld's key features, we present two case studies and demonstrate learning MARL policies using both OpenAI's multi-agent deep deterministic policy gradient (MADDPG) and RLLib's proximal policy optimization (PPO) algorithms. In both cases, at least some subset of agents incorporates elements of the power flow solution at each time step as part of their reward (negative cost) structures.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Lucas应助jujuezhe采纳,获得10
1秒前
Jenny发布了新的文献求助10
1秒前
沉默紫槐完成签到,获得积分10
2秒前
mogumogu发布了新的文献求助10
3秒前
3秒前
easterway完成签到,获得积分10
3秒前
虚拟的代灵关注了科研通微信公众号
5秒前
Avalonx应助斯文的尔冬采纳,获得10
6秒前
Ava应助斯文的尔冬采纳,获得10
6秒前
乐乐乐发布了新的文献求助10
6秒前
6秒前
Avalonx应助spz采纳,获得50
7秒前
7秒前
8秒前
8秒前
多羊完成签到,获得积分10
8秒前
8秒前
9秒前
Amyfighter完成签到,获得积分10
9秒前
小财迷完成签到,获得积分10
9秒前
小次之山完成签到,获得积分10
9秒前
蹦沙卡拉卡的小怪兽完成签到,获得积分10
9秒前
10秒前
虚妄完成签到,获得积分10
10秒前
qhm发布了新的文献求助10
12秒前
薄荷发布了新的文献求助10
14秒前
BeSideWorld完成签到,获得积分10
14秒前
15秒前
16秒前
17秒前
17秒前
pan完成签到,获得积分10
18秒前
19秒前
19秒前
lmgegege发布了新的文献求助10
20秒前
年轻枕头完成签到,获得积分10
20秒前
明理白梦发布了新的文献求助10
20秒前
jianrobsim完成签到,获得积分10
20秒前
WX完成签到 ,获得积分20
20秒前
21秒前
高分求助中
Ideology and Meaning-Making under the Putin Regime 750
Introduction to Industrial/Organizational Psychology 600
Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600
Handbook of Luminescence Dating 500
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Isomerism In Coordination Compounds 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6935297
求助须知:如何正确求助?哪些是违规求助? 8622207
关于积分的说明 18287797
捐赠科研通 6362719
什么是DOI,文献DOI怎么找? 3075248
关于科研通互助平台的介绍 2112700
邀请新用户注册赠送积分活动 2052680