[发明专利]一种半监督行人重识别模型、方法和装置在审
申请号: | 202110939921.4 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113657267A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 赵舶彤;王延杰 | 申请(专利权)人: | 中国科学院长春光学精密机械与物理研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06N5/02 |
代理公司: | 长春中科长光知识产权代理事务所(普通合伙) 22218 | 代理人: | 高一明;郭婷 |
地址: | 130033 吉林省长春*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 行人 识别 模型 方法 装置 | ||
1.一种半监督行人重识别模型的训练方法,其特征在于,包括如下步骤:
S1、利用SPGAN神经网络对有标签的源域数据集的图像进行风格迁移,生成与无标签的目标域数据集的图像风格相匹配的图像,将生成的所述与无标签的目标域数据集的图像风格相匹配的图像输入到ResNet进行预训练,得到基于ResNet的预测值的数据网络;
S2、将利用DBSCAN算法聚类生成的硬伪标签的数据网络和基于ResNet的预测值的数据网络使用平均教师模型进行相互学习与监督,直到所述平均教师模型收敛,得到所述平均教师模型的预测值的数据网络;
S3、将所述基于ResNet的预测值的数据网络和所述平均教师模型的预测值的数据网络载入FPGA,实现所述源域数据集的图像与所述目标域数据集的图像的匹配。
2.根据权利要求1所述的训练方法,其特征在于,所述平均教师模型用于第一训练和第二训练:
所述第一训练包括利用蒸馏学习的方法对生成的所述硬伪标签的数据网络的参数进行更新;
所述第二训练包括利用损失函数减弱所述硬伪标签的数据网络自身的噪声。
3.根据权利要求2所述的训练方法,其特征在于,所述利用蒸馏学习的方法对生成的所述硬伪标签的数据网络的参数进行更新的公式为:
其中,E(T)[θ1]和E(T)[θ2]分别代表经过两组不同的数据增强后由第一训练得到的用于更新所述硬伪标签的数据网络的新的参数;
初始参数E(0)[θ1]=θ1,E(0)[θ2]=θ2;
α代表蒸馏学习所设置的保留旧知识的阈值,其范围为(0,1]。
4.根据权利要求2所述的训练方法,其特征在于,所述损失函数表示为:
其中,β1,β2,1-β1-β2分别为分类损失,三元组损失,吸引损失在损失函数中的权重;
为基于所述ResNet的预测值和所述硬伪标签在所述分类损失函数中的权重;
为基于所述ResNet的预测值和所述硬伪标签在所述三元组损失函数中的权重;
Ltpush代表目标域的距离损失函数;
代表目标域的软三元组损失函数;
代表目标域的软分类损失函数;
代表源域的分类损失函数;
代表目标域的硬标签分类损失函数。
5.根据权利要求1所述的训练方法,其特征在于,所述ResNet的最后的卷积层为Transformer计算模块,用于增强所述ResNet的解耦能力。
6.根据权利要求5所述的训练方法,其特征在于,所述平均教师模型的预测值由所述Transformer计算模块进行提取,计算公式为:
其中,Q=WqA+bq;
K=WkA+bk;
V=WvA+bv;
A=RELU(X+Station);
Station为一个小数矩阵,代表矩阵中每个元素的空间位置;
Wq、Wk、Wv分别代表Q、K、V输出的权重矩阵;
bq、bk、bv分别表示Q、K、V输出的偏差值。
7.一种半监督行人重识别模型,其特征在于,所述半监督行人重识别模型由权利要求1至6任一项所述的训练方法训练得到。
8.一种半监督行人重识别模型的训练装置,其特征在于,所述的装置包括处理器以及存储器,所述处理器调用所述存储器中的数据执行程序,用于实现如权利要求1至6中任一项所述的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院长春光学精密机械与物理研究所,未经中国科学院长春光学精密机械与物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110939921.4/1.html,转载请声明来源钻瓜专利网。