[发明专利]一种基于复合循环神经网络系统的多目标跟踪系统有效
申请号: | 201910941298.9 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110728698B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 史再峰;任辉政;罗韬;曹清洁;范博宇 | 申请(专利权)人: | 天津大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/08;G06N3/0442;G06V20/40;G06V10/74;G06V10/764;G06V10/82 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复合 循环 神经网络 系统 多目标 跟踪 | ||
1.一种基于复合循环神经网络系统的多目标跟踪系统,其特征在于,是基于RNN和GRU构成的复合循环神经网络系统的多目标跟踪网络模型,采用边界框标注被跟踪对象,所述复合循环神经网络系统包括基于RNN的目标检测单元、基于GRU的跟踪管理单元以及基于GRU的数据关联单元,所述多目标跟踪网络模型采用以下步骤处理待测视频数据:
RNN的目标检测单元,输出t时刻对待测视频数据集vt的图像的检测结果集αt={ait}A,ait为t时刻视频帧中检测到的第i个对象,A为至t时刻累计检测到的对象集;
基于GRU的跟踪管理单元,输出t时刻对视频帧中各目标的跟踪结果集βt={bjt}B,bjt为t时刻相应视频帧中被跟踪的第j个对象,B为t时刻相应视频帧中对象的合集;以及,根据上述检测结果集以及跟踪结果集,计算数据关联的相似矩阵Ct=[c(ij)t]A×B,其中c(ij)t是ait与bjt间的欧式距离,c(ij)t=||ait-bjt||2;
基于GRU的数据关联单元,以t时刻的相似矩阵Ct中的子元素c(ij)t为输入,输出结果为t时刻相应图像帧中第j个跟踪结果与当前任一检测结果i间的匹配概率向量a(ij)t,表示t时刻第j个跟踪目标和第i个检测结果间的匹配概率,且Σa(ij)t=1并构成概率向量At,匹配概率最大的目标检测结果视为t时刻相应目标的跟踪结果;
所述基于RNN和GRU构成的复合循环神经网络系统的多目标跟踪网络模型的损失函数如下:
其中ht=∑hlt,分别为复合循环网络系统t时刻的隐藏层状态和t-1时刻预算的t时刻的隐藏层状态,x1,x2,x3,x4为权重值,在网络训练过程中的每次迭代过程进行更新,以使损失最小,N为t时刻检测到的目标总数,M为t时刻跟踪结果数目,D为目标的位置种类信息,D=4;
RNN与GRU网络的每一网络层均有一个相应的隐藏层状态h,t-1时刻预算的t时刻的第l层隐藏层状态的前向传播算法如式所示:
其中,φ()为激活函数,xlt为当前隐藏层的输入,Ul、Wl为权值,bl为偏置;将训练集数据输入模型进行网络训练,训练过程视为以下两步骤的迭代过程:步骤一是基于预设鉴别网络学习率超参数值,利用梯度下降法更新鉴别网络结点参数值,生成网络结点参数值保持不变;步骤二是基于预设生成网络学习率超参数值,利用梯度下降法更新生成网络结点参数值,鉴别网络结点参数值保持不变;训练迭代过程为:执行步骤一多次后,执行步骤二一次,重复该迭代过程,直至损失最小,训练完毕。
2.根据权利要求1所述基于复合循环神经网络系统的多目标跟踪系统,其特征在于,模型的训练集数据通过对来自网络公共数据库的数据进行人工扩充和标注,以得到足够的训练样本集;其中标注过程为通过计算机脚本对视频帧中每个目标对象进行框选,并对不同目标加以编号。
3.根据权利要求2所述基于复合循环神经网络系统的多目标跟踪系统,其特征在于,扩充数据集的方法包含以下两种方式:
(1)对来自网络公共数据库的视频数据集进行人工处理,人工处理的方法包括对视频图像的亮度及对比度进行调节,对行人对象及其运动轨迹进行镜像翻转、对视频图像进行随机平移、随机旋转;
(2)通过物理建模,建立基于网络公共视频数据集中行人对象的轨迹运动模型,即通过对所述视频数据集中行人运动轨迹的初始位置、平均运动速度、加速度三个变量估计其概率分布,然后通过对所述概率分布进行采样并模拟生成多个虚拟运动轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910941298.9/1.html,转载请声明来源钻瓜专利网。