A Multi-Agent Deep Constrained Q-Learning Method for Smart Building Energy Management Under Uncertainties

增强学习 能源管理 计算机科学 智能电网 数学优化 楼宇管理系统 负荷管理 多智能体系统 能量(信号处理) 人工智能 工程类 强化学习 控制(管理) 数学 电气工程 统计
作者
Hossein Saberi,Cuo Zhang,Zhao Yang Dong
出处
期刊:IEEE Transactions on Smart Grid [Institute of Electrical and Electronics Engineers]
卷期号:15 (5): 4649-4661
标识
DOI:10.1109/tsg.2024.3386896
摘要

Data-driven energy management with flexible appliances in smart buildings is a key towards power system operational intelligence. However, the low efficiency of existing deep reinforcement learning (DRL) methods in terms of optimization and computational performance, caused by reward shaping, large neural networks, system-wide constraints and reward allocation of photovoltaic power generation, signifies the need for new system-specific DRL methods. To address these challenges, this paper proposes a multi-agent deep constrained Q-learning method to obtain online optimal solutions for smart building energy management in presence of various uncertainties. The proposed method minimizes daily energy cost via real-time adjustment of flexible appliances, and addressing impacts of the uncertainties. A deep constrained Q-learning algorithm is developed to effectively avoid reward shaping. By adopting multi-layer perception to estimate thermodynamics and electric vehicle charging states, and developing appliance-specific logic, it is novel to calculate the joint safe action space of all appliances during the training process. A multi-agent approach is developed to address the system-wide constraints and the reward allocation, directly in the Q-update, where hyper-parameters of individual agents are tuned separately. Numerical simulation results verify the high efficiency of the proposed method in daily energy cost minimization and online energy management.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
wyr发布了新的文献求助10
刚刚
上官若男应助贺小刚采纳,获得10
2秒前
如意的向彤完成签到,获得积分10
2秒前
无辜善愁完成签到,获得积分10
3秒前
Muggle完成签到,获得积分20
4秒前
6秒前
阿越完成签到 ,获得积分10
7秒前
Anoxia完成签到 ,获得积分10
8秒前
13秒前
15秒前
YY发布了新的文献求助10
16秒前
野原馨之助完成签到 ,获得积分10
16秒前
LYH完成签到 ,获得积分10
17秒前
18秒前
爆米花应助zhangjingchang采纳,获得10
18秒前
LILILI完成签到,获得积分10
22秒前
研友_VZG7GZ应助Olivia采纳,获得30
23秒前
23秒前
于梦寒完成签到,获得积分10
25秒前
眭超阳完成签到 ,获得积分10
26秒前
星辰大海应助迅速的季节采纳,获得10
27秒前
27秒前
贺小刚完成签到,获得积分10
27秒前
于梦寒发布了新的文献求助10
28秒前
24完成签到 ,获得积分10
29秒前
CodeCraft应助自由的枕头采纳,获得10
29秒前
喝水大王完成签到,获得积分20
31秒前
31秒前
hahhhah完成签到 ,获得积分20
31秒前
32秒前
33秒前
33秒前
Akim应助多边形采纳,获得10
33秒前
lyy10214发布了新的文献求助10
34秒前
Olivia发布了新的文献求助30
36秒前
36秒前
金光闪闪完成签到,获得积分10
37秒前
38秒前
xiaotianshi发布了新的文献求助10
40秒前
迅速的季节完成签到,获得积分10
40秒前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
Diagnostic immunohistochemistry : theranostic and genomic applications 6th Edition 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3155762
求助须知:如何正确求助?哪些是违规求助? 2807008
关于积分的说明 7871439
捐赠科研通 2465303
什么是DOI,文献DOI怎么找? 1312209
科研通“疑难数据库(出版商)”最低求助积分说明 629947
版权声明 601905