[发明专利]一种基于意图推理与深度强化学习的移动目标搜索跟踪方法及系统在审
申请号: | 202210581312.0 | 申请日: | 2022-05-26 |
公开(公告)号: | CN114970819A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 白成超;颜鹏;郭继峰;郑红星 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 黑龙江立超同创知识产权代理有限责任公司 23217 | 代理人: | 杨立超;张妍飞 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 意图 推理 深度 强化 学习 移动 目标 搜索 跟踪 方法 系统 | ||
1.一种基于意图推理与深度强化学习的移动目标搜索跟踪方法,其特征在于,包括以下步骤:
步骤一、获取移动目标运动轨迹数据和移动目标所处运动环境地图,以构建训练数据集;
步骤二、对所述训练数据集进行离散化处理,以构建特征地图矩阵;
步骤三、将所述特征地图矩阵输入基于卷积神经网络的目标运动意图推理模型进行训练,获得训练好的目标运动意图推理模型;
步骤四、使用训练好的目标运动意图推理模型推理未知运动轨迹的移动目标的运动意图;
步骤五、基于推理的未知运动轨迹的移动目标的运动意图,预测移动目标在丢失之后的运动轨迹;
步骤六、基于移动目标在丢失之后的运动轨迹,采用深度强化学习方法训练移动目标丢失之后搜索移动目标的搜索策略;
步骤七、利用训练好的搜索策略对丢失的移动目标进行快速搜索,以实现对移动目标的长期跟踪。
2.根据权利要求1所述的一种基于意图推理与深度强化学习的移动目标搜索跟踪方法,其特征在于,步骤二的具体步骤包括:将所述移动目标所处运动环境地图转换为包含NX×NY个栅格单元的栅格地图,其中NX和NY分别表示栅格地图X轴方向和Y轴方向的栅格单元个数;在栅格地图中,将属性为可进入区域所在的栅格单元赋值为N1,将属性为不可进入区域所在的栅格单元赋值为N2,将每个移动目标运动轨迹的多个位置点所在的栅格单元赋值为N3;将每个移动目标运动轨迹的目的地位置所在的栅格单元赋值为N4;0N11,0N21,0N31,0N41,且N1、N2、N3、N4均不相等,从而获得多个特征地图矩阵。
3.根据权利要求2所述的一种基于意图推理与深度强化学习的移动目标搜索跟踪方法,其特征在于,步骤二所述多个特征地图矩阵对应多个时刻的赋值后的栅格地图,设置N1=0.2,N2=0.6,N3=0.4,N4=0.8,用矩阵表示t时刻的特征地图矩阵,定义如下式所示:
式中:表示位于矩阵中第k行第l列的元素;ckl表示栅格地图中位于第k行第l列的栅格单元;c(Bacc)与c(Binacc)分别表示移动目标所处运动环境中可进入区域与不可进入区域所占据的栅格单元集合;c(G)表示移动目标所处运动环境中移动目标的目的地区域所占据的栅格单元集合;表示在t′时刻移动目标所在位置所占据的栅格单元;Tinf表示对移动目标运动意图推理的周期,即每隔时间段Tinf根据移动目标运动状态的改变推理其运动意图。
4.根据权利要求3所述的一种基于意图推理与深度强化学习的移动目标搜索跟踪方法,其特征在于,步骤四的具体步骤包括:对于未知运动轨迹的移动目标,其特征地图矩阵构建如下:在栅格地图中,将属性为可进入区域所在的栅格单元赋值为N1,将属性为不可进入区域所在的栅格单元赋值为N2,实时获取未知运动轨迹的移动目标的位置点,将每个位置点所在的栅格单元赋值为N3,从而实时更新对应不同时刻的赋值后的栅格地图,作为特征地图矩阵输入训练好的目标运动意图推理模型中,获取移动目标前往其各个运动意图即预测目的地位置的概率,表示为表示目的地区域gi所对应的特征矩阵;WCNN表示移动目标运动意图推理模型fCNN的参数;对移动目标前往每个预测目的地位置的概率进行归一化,表示为:
式中,G表示未知运动轨迹的移动目标的预测目的地位置集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210581312.0/1.html,转载请声明来源钻瓜专利网。