[发明专利]基于部分感知马氏决策过程的机器人最优路径规划方法有效

专利信息
申请号: 201810102240.0 申请日: 2018-02-01
公开(公告)号: CN108680155B 公开(公告)日: 2020-09-08
发明(设计)人: 刘全;朱斐;钱炜晟;章宗长 申请(专利权)人: 苏州大学
主分类号: G01C21/20 分类号: G01C21/20;G05D1/02
代理公司: 苏州翔远专利代理事务所(普通合伙) 32251 代理人: 陆金星;姚惠菱
地址: 215104 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 部分 感知 决策 过程 机器人 最优 路径 规划 方法
【权利要求书】:

1.一种基于部分感知马氏决策过程的机器人最优路径规划方法,其特征在于,包括如下步骤:

S1、初始化模型和环境,设置环境的状态迁移函数f:X×U×X→[0,1],奖赏函数观察函数Ω:U×X×Z→[0,1],其中X为状态集合,U为动作集合,Z为观察集合,设置折扣率γ为0.95,设置机器人的位置,设置初始信念状态b0的初始值:下界的标准临界值L和上界的标准临界值其中是预先指定的阈值标准,计算初始信念状态b0的上界值和下界值V(b0),转入S2;

S2、将初始信念状态b0置为当前信念状态b,转入S3;

S3、预测当前信念状态b的最优值转入S4;

S4、判断当前信念状态b是否满足如下条件:且其中db为当前信念状态b的深度,如满足,则转入S13,如不满足,则转入S5;

S5、计算当前信念状态b下,每个动作的值函数下界值,选取这些下界值中的最大值Q,更新当前信念状态b的上界的标准临界值U′和下界的标准临界值L′,转入S6;

S6、计算最优动作和对初始信念状态b0贡献最大的观察,并记录观察的总数count,转入S7;

S7、顺序选择观察集中的观察,若count不为0,转入S8,否则转入S11;

S8、count值减少1,转入S9;

S9、判断当前选择的观察是否有探索的价值,若是,则转入S10,若否,则转入S7;

S10、计算下一信念状态的上界的标准临界值和下界的标准临界值,获得下一信念状态的上界值和下界值,转入S7;

S11、更新当前信念状态的上界值和下界值,转入S12;

S12、选择最优动作进入下一信念状态,将下一信念状态置为当前信念状态,转入S3;

S13、获得最优策略,根据最优策略获得机器人的最优路径。

2.根据权利要求1所述的基于部分感知马氏决策过程的机器人最优路径规划方法,其特征在于,S2中,初始信念状态b0的下界值采用盲策略计算,初始信念状态b0的上界值采用快速通知约束方法计算。

3.根据权利要求1所述的基于部分感知马氏决策过程的机器人最优路径规划方法,其特征在于,S5中,当前信念状态b的下界的标准临界值采用如下公式计算:L′=max{L,Q},当前信念状态b的下界的标准临界值采用如下公式计算:其中Q表示每个动作的值函数下界值中的最大值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810102240.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top