[发明专利]利用训练样本及折中度量的3D卷积神经网络构建方法在审

申请号：	201711033085.3	申请日：	2017-10-30
公开（公告）号：	CN107729993A	公开（公告）日：	2018-02-23
发明（设计）人：	郑苏桐;郭晓强;李小雨;王东飞;周芸;姜竹青;门爱东	申请（专利权）人：	国家新闻出版广电总局广播科学研究院;北京邮电大学
主分类号：	G06N3/04	分类号：	G06N3/04
代理公司：	天津盛理知识产权代理有限公司12209	代理人：	王利文
地址：	100886 北京市西***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	利用训练样本折中度量卷积神经网络构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于视觉行人再识别技术领域，尤其是一种利用训练样本及折中度量的3D卷积神经网络构建方法。

背景技术

随着监控范围的增大，监控数据呈现爆炸式增长。依靠人眼识别监控画面中的行人身份显然十分低效，行人再识别技术的任务便是依靠计算机视觉技术解决不重叠监控视野中行人身份匹配的问题。

行人再识别的传统方法主要分为两个步骤，首先对图像/视频进行特征提取，然后通过度量学习得到不同样本的相似度/距离。随着卷积神经网络技术的兴起，其在行人检测、目标跟踪等视觉任务中表现出了出色的性能，因此，基于深度学习的行人再识别也成为了备受关注的研究方向。然而，现有卷积神经网络存在一定局限性，即其仅仅对单张图像进行处理，而没有对监控视频的帧间信息进行利用，因此匹配效率较低。

发明内容

本发明的目地在于克服现有技术的不足，提出一种设计合理、匹配效率高且性能稳定的利用训练样本及折中度量的3D卷积神经网络构建方法。

本发明解决其技术问题是采取以下技术方案实现的：

一种利用训练样本及折中度量的3D卷积神经网络构建方法，包括以下步骤：

步骤1、构造孪生结构的3D卷积神经网络；

步骤2、设置网络的损失函数，该损失函数由正样本损失、负样本损失及正则化损失构成，并在正则化损失中结合了马氏距离和欧氏距离；

步骤3、使用softmax损失函数，使用视频序列形式的数据集对网络进行预训练；

步骤4、构造正样本对和负样本对，对图像进行预处理和分割；

步骤5、有选择地利用训练样本对网络进行训练。

步骤1构建的3D卷积神经网络，包括如下两个相同的分支网络结构：

3D卷积层→批量归一化层→激活层→Dropout层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→3D卷积层→批量归一化层→激活层→Dropout层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→第一全连接层→第二全连接层。

所述3D卷积层的参数为3*3*3；所述激活层的参数为ReLU；所述Dropout 层的参数为0.2；所述最大池化层的参数为1*2*2；所述第一全连接层的参数为 4096*4096；所述第二全连接层的参数为4096*1000。

所述步骤2的具体处理方法为：

设孪生网络两个输出分别为Ψ(x₁)和Ψ(x₂)，其中x₁和x₂为网络的原始输入数据，Ψ(x₁)和Ψ(x₂)为网络最后的全连接层输出的1000维特征，则这两个样本之间的距离定义为：

d(x₁，x₂)＝||Ψ(x₁)-Ψ(x₂)||₂

并根据下式标记距离的正负性质：

其中I(x_k)(k＝1，2)是x_k的行人身份；

设行人身份相同的样本对为正样本对，行人身份不同的样本对为负样本对；则正样本损失定义为：

其中N_p是正样本对的数目，m是设定的间隔参数；

负样本损失定义为：

其中t是一个阈值，用于判断是否对负样本对距离进行惩罚；

正则化损失定义为：

其中W是最后一层全连接层的参数，λ是平衡参数，当λ较大时，度量方法以欧氏距离为主，当λ较小时，度量方法以马氏距离为主；