[发明专利]一种基于DDQN的自适应动态路径规划方法有效
申请号: | 201910879532.X | 申请日: | 2019-09-17 |
公开(公告)号: | CN110515303B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 张建明;陈新 | 申请(专利权)人: | 余姚市浙江大学机器人研究中心;浙江大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04;G05B13/02;G05D1/02 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 吴秉中 |
地址: | 315400 浙江省宁波市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于DDQN的自适应动态路径规划方法,解决了不同环境下的路径规划问题。本发明主要分为两个部分,第一部分先利用多个障碍物分布不同的地图训练神经网络,直到定义的损失函数不再减小或者减小到一定范围。第二个部分利用训练完成的神经网络在没有经过训练的全新地图上找到最优策略,实现端到端的路径规划。本发明对于不同的地图具有一定的适应性,经过一次训练后可以快速实现从不同的地图任意位置到指定的终点之间决策出一条最优路径。 | ||
搜索关键词: | 一种 基于 ddqn 自适应 动态 路径 规划 方法 | ||
【主权项】:
1.一种基于DDQN的自适应动态路径规划方法,其特征在于,包括以下步骤:/n步骤(1)根据应用场景的实际大小产生一批相同大小,具有相同终点的网格地图,再根据实际应用场景的需要在地图中布置一定数量障碍物,且所有地图的障碍物分布不同,这些地图组成一个训练地图库,同样的生成一个测试地图库;/n步骤(2)根据地图大小和实际环境复杂程度生成一个多层神经网络,其输入个数与地图中每个网格的状态维度相同,输出层的神经元个数与机器人的行为个数相同,随机初始化神经网络的参数;/n步骤(3)任意从训练地图库中取出一个地图,随机在地图中终点之外没有障碍物的网格生成一个代理,在代理与地图交互过程中,记录下所有交互的步骤,并利用这些交互的经历来训练神经网络,直到遍历所有训练地图;/n步骤(4)训练完成之后的模型可用于测试任意没有经过训练的障碍物分布不同的测试地图,在测试地图上随机位置生成一个代理,将代理所处的当前网格的状态特征输入神经网络,根据完全贪婪策略选出最优行为,执行该行为之后代理移动到下一个状态,不断重复此步骤直到找到终点状态。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于余姚市浙江大学机器人研究中心;浙江大学,未经余姚市浙江大学机器人研究中心;浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910879532.X/,转载请声明来源钻瓜专利网。