[发明专利]一种船舶自主导航方法及装置有效
申请号: | 202011535524.2 | 申请日: | 2020-12-23 |
公开(公告)号: | CN112650246B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 杨杰;刘今栋;尚午晟;梁奇;韦港文 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 丁倩 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 船舶 自主 导航 方法 装置 | ||
1.一种船舶自主导航方法,其特征在于,包括以下步骤:
构建船舶运动模型,并基于航行水域地图构建航行水域模型;
基于所述航行水域模型,采用蚁群优化算法进行全局航迹规划,生成全局参考航迹;
基于所述船舶运动模型,采用Q-learning算法进行局部风险避碰规划,生成实时风险避碰策略;
结合所述全局参考航迹和所述局部风险避碰策略实现船舶自主导航;
基于所述船舶运动模型,采用Q-learning算法进行局部风险避碰规划,生成实时风险避碰策略,具体为:
初始化船舶的状态集、动作集和奖励策略;所述状态集包括船舶的多种状态,所述状态包括船舶安全区域之内的障碍物与船舶之间的相对位置信息以及船舶当前航向角;所述动作集包括船舶每一状态下对应的多种动作,所述动作包括平动信息和转动信息;所述奖励策略包括船舶航行过程中与环境交互所反馈的碰撞情况和目标抵达情况;
计算所述动作集中每一动作的Q值,用于表征动作价值;
采用策略从所述动作集中选择动作价值最高的动作,具体为:动作选择采用策略,以一定概率选择价值最高的动作,否则进行随机选择,其数学表达为:
其中,为所选动作,为状态下动作的Q值,表示取最大值时对应的动作,表示可选动作集合,为选择概率,为贪婪度,;
采用Q-learning算法对当前状态下各动作的Q值进行更新:
;
;
其中,为当前状态,为所选动作,为执行动作后的下一状态,为当前状态下反馈的奖励,为学习率,为折扣因子,为状态下动作的Q值,表示状态下动作的Q值,表示取最大值,表示更新;
判断更新前后的Q值之差是否小于设定差值,如果是,则输出Q值最高的动作作为所述实时风险避碰策略,否则进行下一次Q值的更新;
其中,状态集定义方法如下:对于船舶状态集的构建,以船舶位置为圆心,设定阈值为半径所构成的圆内的障碍,与船舶的相对位置信息,结合船舶的当前航向角作为一个状态,记为;动作包括前进与转向,记为,对每个状态下的动作初始化,用Q值来表征动作的价值,某一动作的Q值越大表示在该状态下这一动作的价值越高。
2.根据权利要求1所述的船舶自主导航方法,其特征在于,构建船舶运动模型,具体为:
建立船舶模型;
将船舶的运动分解为随中心点的平动以及绕中心点的转动,将船舶的运动简化为在水平面的运动,得到船舶的运动学描述;
设置转向阈值,对船舶的转向进行约束;
以中心点为圆心、以安全距离为半径,设置船舶的安全区域;
结合所述船舶模型、运动学描述、转向阈值以及安全区域,得到所述船舶运动模型。
3.根据权利要求1所述的船舶自主导航方法,其特征在于,基于航行水域地图构建航行水域模型,具体为:
获取航行水域地图,对所述航行水域地图中障碍物进行边缘提取;
利用Graham扫描法提取边缘的凸包,设置最小边长阈值与最小周长阈值,滤除边长小于最小边长阈值或周长小于最小周长阈值的凸包;
对所述凸包进行等距离缩放,使之完全包围相应的障碍物;
以凸包顶点构造MAKLINK全局连通图,选取MAKLINK全局连通图中所有MAKLINK线的中点、起点和终点作为网络节点;
连接相邻的网络节点得到轨迹规划的无向网络图,以所述无向网络图作为所述航行水域模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011535524.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方便拆卸的燃油滤清器固定支架
- 下一篇:一种高性能煤矸石陶粒的生产工艺