[发明专利]基于Siamese网络的用于行人重识别的方法有效
申请号: | 201810004094.8 | 申请日: | 2018-01-03 |
公开(公告)号: | CN108171184B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 伏长虹;高梽强 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 siamese 网络 用于 行人 识别 方法 | ||
1.一种基于Siamese网络的用于行人重识别的方法,其特征在于,包括以下步骤:
步骤1,预训练ResNet-50网络:将ImageNet数据集作为训练数据集,训练一个ResNet-50网络,使ResNet-50网络具有初始值;
步骤2,调整ResNet-50网络:将ResNet-50网络的softmax输出层替换为一个大小为1*1*4096*n的卷积层,在该卷积层后再加上一个softmax层进行归一化操作;
步骤3,搭建形成一个Siamese网络:将步骤2所得的ResNet-50网络进行复制,然后将两个ResNet-50网络做并行连接,形成一个Siamese网络;
步骤4,完善Siamese网络:将步骤2中的两个1*1*4096*n卷积层数据输入到一个平方层中,平方层后依次加入一个1*1*4096*2的卷积层和一个softmax层,组成一个完整的Siamese网络;
步骤5,预处理训练数据集:将训练数据集中的所有图像进行随机剪裁,得到一组尺寸为224*224的训练数据集,将剪裁后得到的训练数据集顺序打乱,从中抽取相同和不同类别的图像,组成新的训练数据集;
步骤6,训练Siamese网络:使用步骤5中所得的训练数据集,训练步骤4中的Siamese网络,利用随机梯度下降法求解损失函数,对网络中的参数进行升级优化;
步骤7,将待查图像与训练数据集中的图像匹配成图像对:使用训练好的模型进行行人识别,将一幅待查图像作为Siamese网络的一个输入,将训练数据集中的图像作为Siamese网络的另一个输入,与待查图像匹配成图像对,并得到Siamese网络对两图像的判别和分类结果;
步骤8:进行行人重识别:将两张图像的分类结果和两图像是否一致作为判别条件,判断训练数据集中哪些图像和待查图像属于同一个行人。
2.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法,其特征在于,步骤1所述的预训练ResNet-50网络,采用dropout或Batch Normalization方法对图像进行优化,使ResNet-50网络具备图像特征提取的能力。
3.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法,其特征在于,步骤2所述的调整ResNet-50网络,具体为:
将ResNet-50网络的softmax输出层替换为一个大小为1*1*4096*n的卷积层,其中n为训练数据集中图像所属标签总数,经过了这个卷积层后,得到一个1*1*n大小的张量,然后将这个张量输入一个softmax层中进行归一化处理。
4.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法,其特征在于,步骤4所述的完善Siamese网络,具体如下:
步骤2中卷积层的输入即ResNet-50网络的输出,是一个大小为1*1*4096的张量,这个张量表示ResNet-50网络对输入图像提取的特征;将两个ResNet-50网络提取的图像特征通过平方层做相减平方处理,得到两图像的相似度,再通过一个1*1*4096*2的卷基层和一个softmax层,然后将结果归一化处理。
5.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法,其特征在于,步骤6所述的训练Siamese网络,具体如下:
将步骤5中生成的新训练集输入到Siamese网络中进行训练,损失函数分为三个部分:两个ResNet-50网络的交叉熵和经过平方层输出的交叉熵,交叉熵表达式如下:
其中,K为输入图像的个数,i为输入图像的编号,p为这幅图像所属的真实标签,为通过卷积神经网络分类的概率结果;
然后使用随机梯度法对三个损失函数的和求最优解,从而对相应参数优化升级。
6.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法,其特征在于,步骤8所述的进行行人重识别,具体如下:
步骤4中所构建的Siamese网络具备两个功能:对输入图像分类,度量两个输入图像的相似度;如果两图像的分类结果同属一类并且两图像的判别结果为1,那么训练数据集中的图像和待查询图像是同一个行人;如果两图像的分类结果同属一类或者两图像的判别结果为0,则不是同一个行人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810004094.8/1.html,转载请声明来源钻瓜专利网。