[发明专利]基于双一致性约束的行人再识别技术在审
申请号: | 202110312827.6 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113065434A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 姜竹青;裴江波;徐崟淞;门爱东;王海婴 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 一致性 约束 行人 识别 技术 | ||
1.基于双一致性约束的行人再识别技术,其特征在于包括以下步骤:
步骤1、将原始多个相机的数据按其相机标签进行抽样,形成训练批次;
步骤2、对于每一个训练批次,将测试集全部图像输入深度卷积网络模型,经过全局池化提取特征;
步骤3、利用提取特征,分别计算模型的身份判别损失,相机分布对齐损失以及知识一致正则化项,相加作为总损失;
步骤4、利用梯度下降法训练模型至参数收敛;
步骤5、固定模型参数,将检测图像与待检测集输入模型得到身份特征,计算欧氏距离并由大到小排序。
2.根据权利要求1所述的基于双一致性约束的行人再识别技术,其特征在于,所述步骤1的抽样方法包括以下步骤:
(1)对于数据集内所有数据,按照相机属性将其分到不同相机组;
(2)随机抽取两个不同相机;
(3)对于每个相机,随机抽取P个行人,抽取每个行人的K张图像,形成共2PK张图像的训练批次。
3.根据权利要求1所述的基于多相机信息传导的跨场景行人再识别技术,其特征在于,所述步骤2的深度卷积网络包括以下结构:
⑴将Resnet50最后一个池化层后的部分丢弃,将其余结构做为特征编码器;
(2)将特征编码器最后一个残差模块的步长设置为1,使生成的特征图的尺寸变为原来的两倍,获取细粒度的语义信息;
(3)特征编码器后连接一个全连接层分类器,分类器的输入通道为特征编码器的输出维度,分类器输出维度为数据集特征数。
4.根据权利要求1所述的基于多相机信息传导的跨场景行人再识别技术,其特征在于:所述步骤3的身份判别函数,相机分布对齐函数以及知识一致正则化项包括以下步骤:
⑴对于任务中的每一张图像,提取权利要求一步骤二所提取特征作为身份特征;
(2)将身份特征输入分类器得到预测标签,同时利用图像身份标签,计算交叉熵损失作为身份判别函数。
5.根据权利要求1所述的基于多相机信息传导的跨场景行人再识别技术,其特征在于:所述步骤3的相机分布对齐损失包括以下步骤:
⑴对于任务中的每一张图像,提取权利要求一步骤二所提取特征作为身份特征;
(2)按照图像的相机标签,将所提取的特征按相机分类,形成不同相机的特征集合;
(3)计算不同特征集合之间的最大均值差异(Maximum Mean Discrepancy)作为相机分布对齐损失。
6.根据权利要求1所述的基于多相机信息传导的跨场景行人再识别技术,其特征在于:所述步骤3知识一致正则化项包括以下步骤:
⑴对于任务中的每一张图像,提取权利要求一步骤二所提取特征作为身份特征;
(2)对于每一个相机,将属于该相机的身份特征输入分类器得到预测标签,同时利用图像身份标签,计算交叉熵损失作为该相机的身份判别函数;
(3)将不同相机的身份判别函数分别对模型参数求导,作为所学知识;
(4)使用点积运算计算不同相机所学知识的相似性,作为知识一致正则化项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110312827.6/1.html,转载请声明来源钻瓜专利网。