亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Reward Shaping-Based Actor–Critic Deep Reinforcement Learning for Residential Energy Management

强化学习 马尔可夫决策过程 计算机科学 能源消耗 能源管理 电价 马尔可夫过程 需求响应 人工智能 增强学习 运筹学 数学优化 能量(信号处理) 工程类 电力市场 统计 数学 电气工程
作者
Renzhi Lu,Zhenyu Jiang,Huaming Wu,Yuemin Ding,Dong Wang,Hai‐Tao Zhang
出处
期刊:IEEE Transactions on Industrial Informatics [Institute of Electrical and Electronics Engineers]
卷期号:19 (3): 2662-2673 被引量:37
标识
DOI:10.1109/tii.2022.3183802
摘要

Residential energy consumption continues to climb steadily, requiring intelligent energy management strategies to reduce power system pressures and residential electricity bills. However, it is challenging to design such strategies due to the random nature of electricity pricing, appliance demand, and user behavior. This article presents a novel reward shaping (RS)-based actor–critic deep reinforcement learning (ACDRL) algorithm to manage the residential energy consumption profile with limited information about the uncertain factors. Specifically, the interaction between the energy management center and various residential loads is modeled as a Markov decision process that provides a fundamental mathematical framework to represent the decision-making in situations where outcomes are partially random and partially influenced by the decision-maker control signals, in which the key elements containing the agent, environment, state, action, and reward are carefully designed, and the electricity price is considered as a stochastic variable. An RS-ACDRL algorithm is then developed, incorporating both the actor and critic network and an RS mechanism, to learn the optimal energy consumption schedules. Several case studies involving real-world data are conducted to evaluate the performance of the proposed algorithm. Numerical results demonstrate that the proposed algorithm outperforms state-of-the-art RL methods in terms of learning speed, solution optimality, and cost reduction.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Chovink完成签到,获得积分20
2秒前
3秒前
5秒前
小宇子发布了新的文献求助10
10秒前
吴迪发布了新的文献求助10
10秒前
ding应助sqHALO采纳,获得10
16秒前
俭朴的岩发布了新的文献求助10
19秒前
29秒前
34秒前
35秒前
夕禾发布了新的文献求助10
41秒前
42秒前
华仔应助吴迪采纳,获得10
45秒前
48秒前
华海亦发布了新的文献求助10
49秒前
Dande1ion发布了新的文献求助10
54秒前
58秒前
bkagyin应助笨笨信封采纳,获得10
1分钟前
超级无敌泰迪战士完成签到 ,获得积分10
1分钟前
sy1639发布了新的文献求助10
1分钟前
1分钟前
小刘发布了新的文献求助10
1分钟前
Dande1ion完成签到,获得积分10
1分钟前
1分钟前
1分钟前
sqHALO发布了新的文献求助10
1分钟前
sqHALO完成签到,获得积分10
1分钟前
1分钟前
1分钟前
RaeganWehe发布了新的文献求助10
1分钟前
1分钟前
1分钟前
充电宝应助华海亦采纳,获得10
1分钟前
Adan发布了新的文献求助10
1分钟前
1分钟前
CodeCraft应助Adan采纳,获得10
2分钟前
华海亦发布了新的文献求助10
2分钟前
RaeganWehe发布了新的文献求助10
2分钟前
2分钟前
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000
Les Mantodea de guyane 2500
VASCULITIS(血管炎)Rheumatic Disease Clinics (Clinics Review Articles) —— 《风湿病临床》(临床综述文章) 1000
Feldspar inclusion dating of ceramics and burnt stones 1000
What is the Future of Psychotherapy in a Digital Age? 801
The Psychological Quest for Meaning 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5972719
求助须知:如何正确求助?哪些是违规求助? 7299120
关于积分的说明 15995928
捐赠科研通 5111055
什么是DOI,文献DOI怎么找? 2744558
邀请新用户注册赠送积分活动 1710904
关于科研通互助平台的介绍 1622211