[发明专利]行人重识别网络的训练及基于其的行人重识别有效
申请号: | 201710906719.5 | 申请日: | 2017-09-29 |
公开(公告)号: | CN108875487B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 罗浩;张弛 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;卜璐璐 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 识别 网络 训练 基于 | ||
1.一种行人重识别网络的训练方法,其特征在于,所述训练方法包括:
利用分类损失对基准网络进行预训练;以及
联合分类损失和五元组损失对经预训练的基准网络进行调优以得到行人重识别网络;
所述联合分类损失和五元组损失对经预训练的基准网络进行调优包括:
按预定要求和顺序输入五元组的五张样本图片;
基于所述基准网络针对每张所述样本图片输出的预测向量计算分类损失;
基于所述基准网络针对所述五张样本图片输出的特征向量计算五元组损失;以及
基于所计算的分类损失和所计算的五元组损失计算最终的损失以作为所述行人重识别网络的损失。
2.根据权利要求1所述的训练方法,其特征在于,所述利用分类损失对基准网络进行预训练包括:
将样本图片输入到所述基准网络;
将所述基准网络针对所述样本图片输出的预测向量与所述样本图片的标签向量进行比较以得到分类损失;
基于所述分类损失调整所述基准网络的参数;以及
反复进行上述步骤,直到分类准确度和分类损失基本不再变化。
3.根据权利要求2所述的训练方法,其特征在于,所述基准网络为残差网络。
4.根据权利要求3所述的训练方法,其特征在于,在将所述样本图片输入到所述基准网络之前,对所述样本图片实施预处理操作。
5.根据权利要求1所述的训练方法,其特征在于,所述所计算的分类损失为所述五张样本图片的分类损失的平均值。
6.根据权利要求1所述的训练方法,其特征在于,所述五元组损失定义为:
lqt=d(正样本1,正样本2)-d(负样本1,负样本21)+d(负样本21,负样本22)-d(负样本1,正样本2)+a
其中,lqt为五元组损失;正样本1、正样本2、负样本1、负样本21以及负样本22为所述五张样本图片,且正样本1和正样本2为第一行人的两张不同图片,负样本1为第二行人的图片,负样本21和负样本22为第三行人的两张不同图片;d为两张图片的特征向量之间的距离;a为根据需求设置的常数参数。
7.根据权利要求1-6中的任一项所述的训练方法,其特征在于,所述最终的损失为所述所计算的分类损失和所述所计算的五元组损失的加权和。
8.一种行人重识别网络的训练装置,其特征在于,所述训练装置包括:
预训练模块,用于利用分类损失对基准网络进行预训练;以及
调优模块,用于联合分类损失和五元组损失对经预训练的基准网络进行调优以得到行人重识别网络;
所述调优模块对经预训练的基准网络的调优包括:
按预定要求和顺序输入五元组的五张样本图片;
基于所述基准网络针对每张所述样本图片输出的预测向量计算分类损失;
基于所述基准网络针对所述五张样本图片输出的特征向量计算五元组损失;以及
基于所计算的分类损失和所计算的五元组损失计算最终的损失以作为所述行人重识别网络的损失。
9.根据权利要求8所述的训练装置,其特征在于,所述预训练模块对所述基准网络的预训练进一步包括:
将样本图片输入到所述基准网络;
将所述基准网络针对所述样本图片输出的预测向量与所述样本图片的标签向量进行比较以得到分类损失;
基于所述分类损失调整所述基准网络的参数;以及
反复进行上述操作,直到分类准确度和分类损失基本不再变化。
10.根据权利要求9所述的训练装置,其特征在于,所述基准网络为残差网络。
11.根据权利要求10所述的训练装置,其特征在于,所述预训练模块还用于:在将所述样本图片输入到所述基准网络之前,对所述样本图片实施预处理操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710906719.5/1.html,转载请声明来源钻瓜专利网。