[发明专利]基于Siamese网络的用于行人重识别的方法有效

申请号：	201810004094.8	申请日：	2018-01-03
公开（公告）号：	CN108171184B	公开（公告）日：	2020-04-10
发明（设计）人：	伏长虹;高梽强	申请（专利权）人：	南京理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	南京理工大学专利中心 32203	代理人：	薛云燕
地址：	210094 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 siamese 网络用于行人识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于Siamese网络的用于行人重识别的方法，其特征在于，包括以下步骤：

步骤1，预训练ResNet-50网络：将ImageNet数据集作为训练数据集，训练一个ResNet-50网络，使ResNet-50网络具有初始值；

步骤2，调整ResNet-50网络：将ResNet-50网络的softmax输出层替换为一个大小为1*1*4096*n的卷积层，在该卷积层后再加上一个softmax层进行归一化操作；

步骤3，搭建形成一个Siamese网络：将步骤2所得的ResNet-50网络进行复制，然后将两个ResNet-50网络做并行连接，形成一个Siamese网络；

步骤4，完善Siamese网络：将步骤2中的两个1*1*4096*n卷积层数据输入到一个平方层中，平方层后依次加入一个1*1*4096*2的卷积层和一个softmax层，组成一个完整的Siamese网络；

步骤5，预处理训练数据集：将训练数据集中的所有图像进行随机剪裁，得到一组尺寸为224*224的训练数据集，将剪裁后得到的训练数据集顺序打乱，从中抽取相同和不同类别的图像，组成新的训练数据集；

步骤6，训练Siamese网络：使用步骤5中所得的训练数据集，训练步骤4中的Siamese网络，利用随机梯度下降法求解损失函数，对网络中的参数进行升级优化；

步骤7，将待查图像与训练数据集中的图像匹配成图像对：使用训练好的模型进行行人识别，将一幅待查图像作为Siamese网络的一个输入，将训练数据集中的图像作为Siamese网络的另一个输入，与待查图像匹配成图像对，并得到Siamese网络对两图像的判别和分类结果；

步骤8：进行行人重识别：将两张图像的分类结果和两图像是否一致作为判别条件，判断训练数据集中哪些图像和待查图像属于同一个行人。

2.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法，其特征在于，步骤1所述的预训练ResNet-50网络，采用dropout或Batch Normalization方法对图像进行优化，使ResNet-50网络具备图像特征提取的能力。

3.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法，其特征在于，步骤2所述的调整ResNet-50网络，具体为：

将ResNet-50网络的softmax输出层替换为一个大小为1*1*4096*n的卷积层，其中n为训练数据集中图像所属标签总数，经过了这个卷积层后，得到一个1*1*n大小的张量，然后将这个张量输入一个softmax层中进行归一化处理。

4.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法，其特征在于，步骤4所述的完善Siamese网络，具体如下：

步骤2中卷积层的输入即ResNet-50网络的输出，是一个大小为1*1*4096的张量，这个张量表示ResNet-50网络对输入图像提取的特征；将两个ResNet-50网络提取的图像特征通过平方层做相减平方处理，得到两图像的相似度，再通过一个1*1*4096*2的卷基层和一个softmax层，然后将结果归一化处理。

5.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法，其特征在于，步骤6所述的训练Siamese网络，具体如下：

将步骤5中生成的新训练集输入到Siamese网络中进行训练，损失函数分为三个部分：两个ResNet-50网络的交叉熵和经过平方层输出的交叉熵，交叉熵表达式如下：

其中，K为输入图像的个数，i为输入图像的编号，p为这幅图像所属的真实标签，为通过卷积神经网络分类的概率结果；

然后使用随机梯度法对三个损失函数的和求最优解，从而对相应参数优化升级。

6.根据权利要求1所述的基于Siamese网络的用于行人重识别的方法，其特征在于，步骤8所述的进行行人重识别，具体如下：

步骤4中所构建的Siamese网络具备两个功能：对输入图像分类，度量两个输入图像的相似度；如果两图像的分类结果同属一类并且两图像的判别结果为1，那么训练数据集中的图像和待查询图像是同一个行人；如果两图像的分类结果同属一类或者两图像的判别结果为0，则不是同一个行人。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京理工大学，未经南京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810004094.8/1.html，转载请声明来源钻瓜专利网。