亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Kernel-based diffusion approximated Markov decision processes for autonomous navigation and control on unstructured terrains

马尔可夫决策过程 贝尔曼方程 计算机科学 强化学习 核(代数) 数学优化 偏微分方程 地形 运动规划 马尔可夫链 马尔可夫过程 代表(政治) 人工智能 数学 机器学习 机器人 政治 统计 组合数学 生物 数学分析 生态学 法学 政治学
作者
Junhong Xu,Kai Yin,Zheng Chen,Jason M. Gregory,Ethan Stump,Lantao Liu
出处
期刊:The International Journal of Robotics Research [SAGE]
卷期号:43 (7): 1056-1080
标识
DOI:10.1177/02783649231225977
摘要

We propose a diffusion approximation method to the continuous-state Markov decision processes that can be utilized to address autonomous navigation and control in unstructured off-road environments. In contrast to most decision-theoretic planning frameworks that assume fully known state transition models, we design a method that eliminates such a strong assumption that is often extremely difficult to engineer in reality. We first take the second-order Taylor expansion of the value function. The Bellman optimality equation is then approximated by a partial differential equation, which only relies on the first and second moments of the transition model. By combining the kernel representation of the value function, we design an efficient policy iteration algorithm whose policy evaluation step can be represented as a linear system of equations characterized by a finite set of supporting states. We first validate the proposed method through extensive simulations in 2 D obstacle avoidance and 2.5 D terrain navigation problems. The results show that the proposed approach leads to a much superior performance over several baselines. We then develop a system that integrates our decision-making framework with onboard perception and conduct real-world experiments in both cluttered indoor and unstructured outdoor environments. The results from the physical systems further demonstrate the applicability of our method in challenging real-world environments.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
4秒前
宝字盖发布了新的文献求助10
9秒前
汉堡包应助宝字盖采纳,获得10
13秒前
wujuan完成签到 ,获得积分10
14秒前
19秒前
qwdqw发布了新的文献求助10
23秒前
qwdqw完成签到,获得积分10
31秒前
1分钟前
1分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
3分钟前
爱静静应助苗条绝义采纳,获得30
3分钟前
3分钟前
3分钟前
童念之发布了新的文献求助10
3分钟前
老石完成签到 ,获得积分10
3分钟前
3分钟前
Georgechan完成签到,获得积分10
3分钟前
3分钟前
懦弱的寄琴完成签到 ,获得积分10
4分钟前
唉呀妈呀发布了新的文献求助100
4分钟前
爱静静应助苗条绝义采纳,获得30
4分钟前
4分钟前
yaoyaoyao完成签到 ,获得积分10
4分钟前
5分钟前
5分钟前
5分钟前
5分钟前
清脆如娆完成签到 ,获得积分10
6分钟前
6分钟前
宝字盖发布了新的文献求助10
6分钟前
6分钟前
7分钟前
8分钟前
爱静静完成签到,获得积分0
8分钟前
浠苒发布了新的文献求助10
8分钟前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Mechanistic Modeling of Gas-Liquid Two-Phase Flow in Pipes 2500
Structural Load Modelling and Combination for Performance and Safety Evaluation 1000
Conference Record, IAS Annual Meeting 1977 610
電気学会論文誌D(産業応用部門誌), 141 巻, 11 号 510
Virulence Mechanisms of Plant-Pathogenic Bacteria 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3562020
求助须知:如何正确求助?哪些是违规求助? 3135557
关于积分的说明 9412594
捐赠科研通 2835934
什么是DOI,文献DOI怎么找? 1558802
邀请新用户注册赠送积分活动 728467
科研通“疑难数据库(出版商)”最低求助积分说明 716878