[发明专利]一种基于策略重用和强化学习的导航路径规划方法有效

申请号：	201910255926.8	申请日：	2019-04-01
公开（公告）号：	CN110081893B	公开（公告）日：	2020-09-25
发明（设计）人：	郝建业;王汉超;侯韩旭	申请（专利权）人：	东莞理工学院
主分类号：	G01C21/34	分类号：	G01C21/34;G01C21/20
代理公司：	深圳市道勤知酷知识产权代理事务所(普通合伙) 44439	代理人：	何兵;饶盛添
地址：	523000 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于策略重用和强化学习的导航路径规划方法，它属于导航路径规划技术领域。本发明解决了现有方法对源策略的重用不充分的问题。本发明引入表示状态重要性的函数来辅助策略选择、策略重用以及策略库重构，实现了在路网地图中快速规划导航路径的目的。相比较于现有传统路径规划方法，本发明的算法ARES‑TL采用了基于策略重用的强化学习算法，并实时更新完整的策略库，通过占用一些空间存储策略库来节约算法时间，且强化学习算法能应对在线微量更新的地图，同时相对于同类型的策略重用方法，本发明的算法ARES‑TL相对于PRQL以及OPS‑TL规避了对不相干的源策略的重用导致的负迁移，提高了探索效率且能准确地完成导航任务。本发明可以应用于导航路径规划技术领域。
搜索关键词：	一种基于策略重用强化学习导航路径规划方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于策略重用和强化学习的导航路径规划方法，其特征在于，该方法包括以下步骤：步骤一、选取当前路网地图对应的策略库，计算策略库中未包含关键地图位置的源策略的重要状态；步骤二、设置最大训练周期的个数为K，利用置信度从策略库的源策略中选取出重用策略，并对自身策略或选取出的重用策略进行重用；步骤三、策略重用获得的新策略通过强化学习进行更新，获得更新后的新策略；步骤四、判断是否将更新后的新策略加入策略库中，若加入，则获得新的策略库继续用于导航路径规划；若不加入，则将原策略库继续用于导航路径规划。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东莞理工学院，未经东莞理工学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910255926.8/，转载请声明来源钻瓜专利网。

上一篇：一种高精度电子地图导航方法及装置
下一篇：一种基于道路结构权值融合的无人车轨迹实时规划方法

同类专利

专利分类

G 物理

G01 测量；测试
G01C 测量距离、水准或者方位；勘测；导航；陀螺仪；摄影测量学或视频测量学
G01C21-00 导航；不包含在G01C 1/00至G01C 19/00组中的导航仪器
G01C21-02 .应用天文学的方法
G01C21-04 .应用陆地测量法
G01C21-10 .通过速度或加速度的测量
G01C21-20 .执行导航计算的仪器
G01C21-24 .专用于宇宙航行的导航

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于策略重用和强化学习的导航路径规划方法有效

专利文献下载