Efficient reinforcement learning with partial observables for fluid flow control

可见的 强化学习 部分可观测马尔可夫决策过程 子空间拓扑 马尔可夫决策过程 计算机科学 流量(数学) 状态空间 弹道 空格(标点符号) 过程(计算) 财产(哲学) 马尔可夫过程 数学优化 控制(管理) 控制理论(社会学) 算法 数学 人工智能 物理 几何学 操作系统 天文 哲学 认识论 统计 量子力学
作者
Akira Kubo,Masaki Shimizu
出处
期刊:Physical review [American Physical Society]
卷期号:105 (6) 被引量:2
标识
DOI:10.1103/physreve.105.065101
摘要

Even if the trajectory in a viscous flow system stays within a low dimensional subspace in the state space, reinforcement learning (RL) requires many observables in the active control problem. This is because the observables are assumed to follow a policy-independent Markov decision process in the usual RL framework and full observation of the system is required to satisfy this assumption. Although RL with a partially observable condition is generally a difficult task, we construct a consistent algorithm with the condition using the low dimensional property of viscous flow. Using typical examples of active flow control, we show that our algorithm is more stable and efficient than the existing RL algorithms, even under a small number of observables.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
打打应助科研通管家采纳,获得10
刚刚
iNk应助科研通管家采纳,获得20
刚刚
隐形曼青应助科研通管家采纳,获得10
刚刚
所所应助科研通管家采纳,获得10
1秒前
科研通AI5应助科研通管家采纳,获得10
1秒前
英俊的铭应助科研通管家采纳,获得10
1秒前
天天快乐应助科研通管家采纳,获得30
1秒前
iNk应助科研通管家采纳,获得20
1秒前
丘比特应助科研通管家采纳,获得10
1秒前
1秒前
我是老大应助小酥肉采纳,获得10
1秒前
科目三应助Anaturez采纳,获得10
2秒前
Junlin完成签到,获得积分10
2秒前
科研搬运工完成签到,获得积分10
2秒前
愫浅完成签到 ,获得积分10
2秒前
LlLly发布了新的文献求助10
5秒前
果味桃完成签到,获得积分10
5秒前
5秒前
6秒前
6秒前
zhaozhao228完成签到,获得积分10
7秒前
7秒前
7秒前
情怀应助伶俐绿柏采纳,获得10
8秒前
上官若男应助ahhh采纳,获得10
8秒前
kytm完成签到,获得积分10
9秒前
9秒前
科目三应助化学采纳,获得10
9秒前
阿猩a完成签到 ,获得积分10
9秒前
禹宛白发布了新的文献求助10
10秒前
SYLH应助单身的溪流采纳,获得10
11秒前
sc应助单身的溪流采纳,获得10
11秒前
烟花应助单身的溪流采纳,获得10
11秒前
小周发布了新的文献求助30
13秒前
梅子完成签到 ,获得积分10
13秒前
77发布了新的文献求助10
14秒前
莉亚发布了新的文献求助30
14秒前
苗条的酸奶完成签到,获得积分10
14秒前
田様应助indigo采纳,获得10
16秒前
16秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
Evaluating the Cardiometabolic Efficacy and Safety of Lipoprotein Lipase Pathway Targets in Combination With Approved Lipid-Lowering Targets: A Drug Target Mendelian Randomization Study 500
Crystal Nonlinear Optics: with SNLO examples (Second Edition) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3733238
求助须知:如何正确求助?哪些是违规求助? 3277380
关于积分的说明 10002340
捐赠科研通 2993231
什么是DOI,文献DOI怎么找? 1642568
邀请新用户注册赠送积分活动 780522
科研通“疑难数据库(出版商)”最低求助积分说明 748888