[发明专利]利用训练样本及折中度量的3D卷积神经网络构建方法在审
申请号: | 201711033085.3 | 申请日: | 2017-10-30 |
公开(公告)号: | CN107729993A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 郑苏桐;郭晓强;李小雨;王东飞;周芸;姜竹青;门爱东 | 申请(专利权)人: | 国家新闻出版广电总局广播科学研究院;北京邮电大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 天津盛理知识产权代理有限公司12209 | 代理人: | 王利文 |
地址: | 100886 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 训练 样本 折中 度量 卷积 神经网络 构建 方法 | ||
技术领域
本发明属于视觉行人再识别技术领域,尤其是一种利用训练样本及折中度量的3D卷积神经网络构建方法。
背景技术
随着监控范围的增大,监控数据呈现爆炸式增长。依靠人眼识别监控画面中的行人身份显然十分低效,行人再识别技术的任务便是依靠计算机视觉技术解决不重叠监控视野中行人身份匹配的问题。
行人再识别的传统方法主要分为两个步骤,首先对图像/视频进行特征提取,然后通过度量学习得到不同样本的相似度/距离。随着卷积神经网络技术的兴起,其在行人检测、目标跟踪等视觉任务中表现出了出色的性能,因此,基于深度学习的行人再识别也成为了备受关注的研究方向。然而,现有卷积神经网络存在一定局限性,即其仅仅对单张图像进行处理,而没有对监控视频的帧间信息进行利用,因此匹配效率较低。
发明内容
本发明的目地在于克服现有技术的不足,提出一种设计合理、匹配效率高且性能稳定的利用训练样本及折中度量的3D卷积神经网络构建方法。
本发明解决其技术问题是采取以下技术方案实现的:
一种利用训练样本及折中度量的3D卷积神经网络构建方法,包括以下步骤:
步骤1、构造孪生结构的3D卷积神经网络;
步骤2、设置网络的损失函数,该损失函数由正样本损失、负样本损失及正则化损失构成,并在正则化损失中结合了马氏距离和欧氏距离;
步骤3、使用softmax损失函数,使用视频序列形式的数据集对网络进行预训练;
步骤4、构造正样本对和负样本对,对图像进行预处理和分割;
步骤5、有选择地利用训练样本对网络进行训练。
步骤1构建的3D卷积神经网络,包括如下两个相同的分支网络结构:
3D卷积层→批量归一化层→激活层→Dropout层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→3D卷积层→批量归一化层→激活层→Dropout层→3D卷积层→批量归一化层→激活层→Dropout层→最大池化层→第一全连接层→第二全连接层。
所述3D卷积层的参数为3*3*3;所述激活层的参数为ReLU;所述Dropout 层的参数为0.2;所述最大池化层的参数为1*2*2;所述第一全连接层的参数为 4096*4096;所述第二全连接层的参数为4096*1000。
所述步骤2的具体处理方法为:
设孪生网络两个输出分别为Ψ(x1)和Ψ(x2),其中x1和x2为网络的原始输入数据,Ψ(x1)和Ψ(x2)为网络最后的全连接层输出的1000维特征,则这两个样本之间的距离定义为:
d(x1,x2)=||Ψ(x1)-Ψ(x2)||2
并根据下式标记距离的正负性质:
其中I(xk)(k=1,2)是xk的行人身份;
设行人身份相同的样本对为正样本对,行人身份不同的样本对为负样本对;则正样本损失定义为:
其中Np是正样本对的数目,m是设定的间隔参数;
负样本损失定义为:
其中t是一个阈值,用于判断是否对负样本对距离进行惩罚;
正则化损失定义为:
其中W是最后一层全连接层的参数,λ是平衡参数,当λ较大时,度量方法以欧氏距离为主,当λ较小时,度量方法以马氏距离为主;
整体损失函数如下:
L=Lp+Ln+Lb。
所述步骤4的具体处理方法为:首先将输入图像统一为宽度为128像素,高度为64像素尺寸,并对原始图像进行Retinex处理;然后将图像分割为上中下有重叠的三部分,三部分的尺寸均为64*64;最后将这三部分的图像序列叠加在一起,构成输入数据。
所述步骤5的具体处理方法为:根据步骤2中的正样本损失和负样本损失,对于符合条件的样本对,计算损失函数并采用随机梯度下降更新模型参数。
本发明的优点和积极效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家新闻出版广电总局广播科学研究院;北京邮电大学,未经国家新闻出版广电总局广播科学研究院;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711033085.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种终端状态变化时长的调整方法及装置
- 下一篇:一种信息处理方法及移动终端