[发明专利]一种基于卷积循环网络的行人重识别方法有效
申请号: | 201810465870.4 | 申请日: | 2018-05-16 |
公开(公告)号: | CN108764308B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 王家宝;苗壮;李阳;张洋硕 | 申请(专利权)人: | 中国人民解放军陆军工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
地址: | 210007 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 循环 网络 行人 识别 方法 | ||
1.一种基于卷积循环网络的行人重识别方法,其特征在于,包括如下步骤:
步骤1、获取跨摄像机行人图像,构建一个行人重识别训练数据集,所述训练数据集中包含预设数量的行人图像;
步骤2、构造一个行人特征提取的卷积循环网络,所述卷积循环网络可以提取预设维度的哈希二值向量特征;
步骤3、构造一个行人重识别孪生网络,并针对成对特征设计一个优化目标函数;
步骤4、利用所述训练数据集训练孪生网络,获得行人重识别特征提取的卷积循环网络模型参数;
步骤5、对跨摄像机拍摄的行人图像进行特征提取;
步骤6、计算跨摄像机行人特征相似度,根据相似度大小完成行人跨摄像机重识别。
2.根据权利要求1所述的基于卷积循环网络的行人重识别方法,其特征在于,获取跨摄像机行人图像,构建一个行人重识别训练数据集,所述训练数据集中包含预设数量的行人图像的步骤具体包括:
步骤1.1、对于拍摄场景无交叠的多个摄像机,若同一行人先后经过摄像机,则会在多个摄像机中出现该行人的画面;
步骤1.2、对一个摄像机拍摄的视频文件或视频流,采用背景差法中的高斯混合模型来检测运动前景;
步骤1.3、对于存在运动前景的视频帧,采用预训练的行人检测器对行人进行检测,精确定位并裁剪行人区域图像作为行人图像;
步骤1.4、在不同摄像机上重复步骤1.2至步骤1.3的过程,提取行人图像;
步骤1.5、将行人图像缩放至固定大小;
步骤1.6、采用人工标注方式将不同摄像机上提取的同一行人标注为同一个类,并赋予一个编号,不同类之间采用不同的编号表示;
步骤1.7、采用上述方法构建训练数据集,当训练数据集规模包含预设数量的行人图像时,可停止收集数据。
3.根据权利要求1所述的基于卷积循环网络的行人重识别方法,其特征在于,构造一个行人特征提取的卷积循环网络,所述卷积循环网络可以提取预设维度的哈希二值向量特征的步骤具体包括:
行人特征提取的卷积循环网络由若干卷积单元、循环单元,以及池化层构成;其中每个卷积单元由一个批量归一化层、一个卷积层和一个非线性激活层构成;循环单元由若干门控单元构成;给定一幅行人图像,经卷积循环网络计算后转化为一个高维向量作为行人特征。
4.根据权利要求1所述的基于卷积循环网络的行人重识别方法,其特征在于,构造一个行人重识别孪生网络,并针对成对特征设计一个优化目标函数的步骤具体包括:
复制步骤2中构建的卷积循环网络,构造一个结构相同和参数共享的孪生网络,该孪生网络的两个子网络,可分别接受一幅行人图像作为输入,生成两个行人的输出特征;
成对输入的图像特征,定义度量两个特征的相似度函数s(fi,fj)=cos(fi,fj),其中,fi,fj分别为行人图像经卷积循环网络得到的特征向量,函数cos(·)表示余弦函数;
根据相似度函数,定义如下损失函数L(fi,fj)=cos(fi,fj);
为了防止过拟合,增加一个正则化项,定义为L(W)=∑k||Wk||2,其中Wk表示卷积循环网络第k层参数;
优化目标函数为损失和正则化项的综合L=L(fi,fj)+λL(W),其中λ为正则化参数。
5.根据权利要求1所述的基于卷积循环网络的行人重识别方法,其特征在于,利用所述训练数据集训练孪生网络,获得行人重识别特征提取的卷积循环网络模型参数的步骤具体包括:
求解目标函数关于特征的偏导数
利用孪生网络前向传播和反向传播计算目标函数相对卷积循环网络各层参数和输入的偏导数;
对各层参数利用随机梯度下降进行参数更新学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军工程大学,未经中国人民解放军陆军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810465870.4/1.html,转载请声明来源钻瓜专利网。