[发明专利]基于生物启发神经网络和强化学习的无人艇路径规划方法有效
申请号: | 202010174346.9 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111290398B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 张涛;夏茂栋;杨波;张晨 | 申请(专利权)人: | 东南大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 蒋昱 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生物 启发 神经网络 强化 学习 无人 路径 规划 方法 | ||
1.基于生物启发神经网络和强化学习的无人艇路径规划方法,其特征在于,包括如下步骤:
S1:动态调整栅格大小;
所述的步骤S1中考虑无人艇的实际大小,对原始图片中的栅格进行压缩;
S2:改进动作集;
所述的步骤S2中动作集设计为上、下、左、右、上左、上右、下左、下右8个动作和动作步长为2个网格长度;
S3:生物启发神经网络优化设计奖励函数;
所述的步骤S3中采用生物启发神经算法,依据每个点周围刺激和抑制输入,计算该点的活性值,将前后的两点的活性差值作为奖励值;
S4:设计贪婪策略;
所述的步骤S4中贪婪策略涵盖初始阶段无人艇以大概率随机搜索,随着搜索次数不断累加,随机搜索的概率不断降低,最后以最大值为贪婪策略;
S5:训练样本,记录每次训练的协方差和Q表;
所述的步骤S5中设定初始点和目标点,开始训练,每次达到最大迭代次数或到达目标点,结束单次循环,每十次记录最小方差,当小于一定的阈值停止整个训练过程,保存Q表;
S6:还原路径;
所述的步骤S6中将规划完成的路径中的每一个点进行标记,将压缩的图片还原的过程中,只要将标记点进行重新赋值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010174346.9/1.html,转载请声明来源钻瓜专利网。