Sampled-data Control of Probabilistic Boolean Control Networks: A Deep Reinforcement Learning Approach

强化学习 计算机科学 概率逻辑 可扩展性 马尔可夫决策过程 控制器(灌溉) 数学优化 人工智能 马尔可夫过程 数学 农学 数据库 生物 统计
作者
Amol Yerudkar,Evangelos Chatzaroulas,Carmen Del Vecchio,Sotiris Moschoyiannis
出处
期刊:Information Sciences [Elsevier]
标识
DOI:10.1016/j.ins.2022.11.030
摘要

The rise of reinforcement learning (RL) has guided a new paradigm: unraveling the intervention strategies to control systems with unknown dynamics. Model-free RL provides an exhaustive framework to devise therapeutic methods to alter the regulatory dynamics of gene regulatory networks (GRNs). This paper presents an RL-based technique to control GRNs modeled as probabilistic Boolean control networks (PBCNs). In particular, a double deep- Q network (DD Q N) approach is proposed to address the sampled-data control (SDC) problem of PBCNs, and optimal state feedback controllers are obtained, rendering the PBCNs stabilized at a given equilibrium point. Our approach is based on options , i.e., the temporal abstractions of control actions in the Markov decision processes (MDPs) framework. First, we define options and hierarchical options and give their properties. Then, we introduce multi-time models to compute the optimal policies leveraging the options framework. Furthermore, we present a DD Q N algorithm: i) to concurrently design the feedback controller and the sampling period; ii) wherein the controller intelligently decides the sampled period to update the control actions under the SDC scheme. The presented method is model-free and offers scalability, thereby providing an efficient way to control large-scale PBCNs. Finally, we compare our control policy with state-of-the-art control techniques and validate the presented results.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
欣慰的寒蕾完成签到,获得积分20
刚刚
平常芷波发布了新的文献求助20
1秒前
简单勒完成签到,获得积分20
1秒前
1秒前
juju1234发布了新的文献求助10
1秒前
执行正义完成签到,获得积分10
2秒前
ab古发布了新的文献求助20
3秒前
刘震完成签到,获得积分10
3秒前
3秒前
3秒前
科研通AI2S应助黑鲨采纳,获得10
4秒前
情怀应助破茧采纳,获得10
4秒前
橘子完成签到,获得积分10
4秒前
tjxhtj完成签到,获得积分10
5秒前
李斯濛发布了新的文献求助10
5秒前
Lucas应助炸炸呦采纳,获得10
6秒前
6秒前
6秒前
Raye发布了新的文献求助10
6秒前
7秒前
一个橙发布了新的文献求助10
7秒前
Allen完成签到,获得积分10
7秒前
橘子发布了新的文献求助10
7秒前
8秒前
wbb发布了新的文献求助10
9秒前
嘉麓发布了新的文献求助10
9秒前
10秒前
11秒前
more发布了新的文献求助10
12秒前
yuer发布了新的文献求助10
13秒前
Ccsp发布了新的文献求助10
14秒前
虚幻又菡发布了新的文献求助10
15秒前
15秒前
Hello应助如风采纳,获得10
15秒前
Owen应助稽TR采纳,获得10
16秒前
he完成签到,获得积分10
16秒前
16秒前
16秒前
19秒前
19秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Digital Twins of Advanced Materials Processing 2000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6041321
求助须知:如何正确求助?哪些是违规求助? 7780744
关于积分的说明 16233982
捐赠科研通 5187337
什么是DOI,文献DOI怎么找? 2775755
邀请新用户注册赠送积分活动 1758873
关于科研通互助平台的介绍 1642368