[发明专利]重识别网络的训练、重识别方法、装置和系统有效
申请号: | 201711360237.0 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108108754B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 罗浩;张弛 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 金相允 |
地址: | 100000 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 网络 训练 方法 装置 系统 | ||
本发明提供了重识别网络的训练、重识别方法、装置和系统,通过获取批处理训练数据;分别获取批处理训练数据中包括的N张图片对应的特征向量,根据每张图片分别对应的特征向量,计算特征向量两两之间的距离,并得到距离矩阵;依据计算得到的距离矩阵,选取距离最大的正样本对和距离最小的负样本对,利用选取的这两个边界样本对计算卷积神经网络的损失,从而训练模型,通过学习最难的正样本对和负样本对计算卷积神经网络的损失,可以增加卷积神经网络模型的泛化能力,提高识别精度。
技术领域
本发明涉及图像识别技术领域,尤其是涉及重识别网络的训练、重识别方法、装置和系统。
背景技术
对行人的重识别,在安防监控视频应用中是一个非常重要的问题。行人重识别,是指在检测某个摄像头中的某个行人是否曾经出现在其他的摄像头中。目前,主要是通过表征学习和度量学习两种方法来进行重识别的。表征学习是将每个行人作为一个类别,将行人重识别转化为图像分类问题。度量学习是提取每张行人图片的特征,计算两种图片的特征的距离,然后随机在训练样本中选择正样本对和负样本对,这种方法对于参与卷积神经网络的样本对来说,大部分是简单易区分的样本对,这样就限制了卷积神经网络的泛化能力。
发明内容
有鉴于此,本发明的目的在于提供重识别网络的训练、重识别方法、装置和系统,可以增加卷积神经网络模型的泛化能力,提高识别精度。
第一方面,本发明实施例提供了重识别网络的训练方法,所述方法包括:
获取批处理训练数据,所述批处理训练数据包括N张图片,其中,N为正整数;
将每张图片分别通过卷积神经网络,得到所述每张图片分别对应的特征向量;
计算所述特征向量两两之间的距离,并根据所述距离得到距离矩阵;
根据所述距离矩阵得到正样本对距离和负样本对距离;
根据所述正样本对距离和所述负样本对距离得到所述卷积神经网络的损失,根据所述损失对所述卷积神经网络进行训练;
重新获取另一组批处理训练数据,并重复上述步骤对所述卷积神经网络进行训练,直至所述卷积神经网络的损失收敛。
进一步的,所述每张图片分别对应相应的训练标签,所述训练标签包括所述识别对象的标识符ID,所述根据所述距离矩阵得到正样本对距离和负样本对距离,包括:
从所述距离矩阵中选取所述标识符ID相同的距离和所述标识符ID不同的距离;
将所述标识符ID相同的距离进行重组,得到正样本距离矩阵;
将所述标识符ID不同的距离进行重组,得到负样本距离矩阵;
从所述正样本距离矩阵中选取最大的距离,作为所述正样本对距离;
从所述负样本距离矩阵中选取最小的距离,作为所述负样本对距离。
进一步的,所述根据所述正样本对距离和所述负样本对距离得到所述卷积神经网络的损失,包括:
根据所述正样本对距离和所述负样本对距离得到边界样本损失;
根据所述边界样本损失和分类损失的加权平均值,得到所述卷积神经网络的损失。
进一步的,所述根据所述正样本对距离和所述负样本对距离得到边界样本损失,包括:
根据下式计算所述边界样本损失:
Le={max(Mp)-min(MN)+α}+
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711360237.0/2.html,转载请声明来源钻瓜专利网。