Online Operational Decision-Making for Integrated Electric-Gas Systems With Safe Reinforcement Learning

强化学习 马尔可夫决策过程 计算机科学 电力系统 最大化 可扩展性 数学优化 马尔可夫过程 人工智能 功率(物理) 数学 量子力学 数据库 统计 物理
作者
Ahmed Rabee Sayed,Xian Zhang,Guibin Wang,Jing Qiu,Cheng Wang
出处
期刊:IEEE Transactions on Power Systems [Institute of Electrical and Electronics Engineers]
卷期号:39 (2): 2893-2906 被引量:6
标识
DOI:10.1109/tpwrs.2023.3320172
摘要

Increasing interdependencies between power and gas systems and integrating large-scale intermittent renewable energy increase the complexity of energy management problems. This article proposes a model-free safe deep reinforcement learning (DRL) approach to find fast optimal energy flow (OEF), guaranteeing its feasibility in real-time operation with high computational efficiency. A constrained Markov decision process model is standardized for the optimization problem of OEF with a limited number of state and control actions and developing a robust integrated environment. Because state-of-the-art DRL algorithms lack safety guarantees, this article develops a soft-constraint enforcement method to adaptively encourage the control policy in the safety direction with non-conservative control actions. The overall procedure, namely the constrained soft actor-critic (C-SAC) algorithm, is off-policy, entropy maximization-based, sample-efficient, and scalable with low hyper-parameter sensitivity. The proposed C-SAC algorithm validates its superiority over the existing learning-based safety ones and OEF solution methods by finding fast OEF decisions with near-zero degrees of constraint violations. The proposed approach indicates its practicability for real-time energy system operation and extensions for other potential applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
tesla发布了新的文献求助10
刚刚
1秒前
丝丢皮得完成签到 ,获得积分10
2秒前
3秒前
3秒前
桐桐应助复杂的雪巧采纳,获得10
5秒前
5秒前
无名老大应助不问悲欢采纳,获得30
5秒前
一棵好困芽完成签到 ,获得积分20
6秒前
怒发5篇sci完成签到,获得积分10
6秒前
明理碧完成签到,获得积分10
7秒前
岳苏佳完成签到,获得积分10
7秒前
8秒前
老迟到的从露完成签到,获得积分10
9秒前
9秒前
Amy发布了新的文献求助30
9秒前
9秒前
9秒前
爱学习的小学生完成签到,获得积分10
12秒前
Rab_b1t发布了新的文献求助10
12秒前
怒发5篇sci发布了新的文献求助10
12秒前
bkagyin应助大音响贴贴采纳,获得10
13秒前
杨诚发布了新的文献求助10
14秒前
虚幻的山水完成签到,获得积分20
14秒前
tianx发布了新的文献求助10
15秒前
16秒前
Rab_b1t完成签到,获得积分10
17秒前
科研通AI5应助飞翔的企鹅采纳,获得10
18秒前
AAA完成签到,获得积分10
19秒前
19秒前
我爱读文献完成签到,获得积分10
20秒前
思源应助ff采纳,获得10
21秒前
Tyj发布了新的文献求助30
22秒前
大个应助123456采纳,获得10
23秒前
xiao5424liu完成签到 ,获得积分20
25秒前
25秒前
26秒前
26秒前
打打应助积极松鼠采纳,获得10
30秒前
我是老大应助茶色玻璃采纳,获得10
31秒前
高分求助中
Continuum Thermodynamics and Material Modelling 4000
Production Logging: Theoretical and Interpretive Elements 2700
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
El viaje de una vida: Memorias de María Lecea 800
Theory of Block Polymer Self-Assembly 750
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3514588
求助须知:如何正确求助?哪些是违规求助? 3096951
关于积分的说明 9233306
捐赠科研通 2791978
什么是DOI,文献DOI怎么找? 1532173
邀请新用户注册赠送积分活动 711816
科研通“疑难数据库(出版商)”最低求助积分说明 707031