[发明专利]一种行人重识别模型训练的方法、装置和设备有效
申请号: | 202210181439.3 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114663685B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 蒋敏;马磊;孔军 | 申请(专利权)人: | 江南大学 |
主分类号: | G06V10/62 | 分类号: | G06V10/62;G06V40/10;G06V20/30;G06V10/42;G06V10/762;G06V10/774;G06V10/82;G06N3/045;G06N3/0464;G06N3/098 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 冯瑞 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行人 识别 模型 训练 方法 装置 设备 | ||
1.一种行人重识别模型训练方法,其特征在于,包括:
基于预训练的两个神经网络构建第一行人重识别网络模型和第二行人重识别网络模型,每个行人重识别网络模型包括卷积神经网络、Transformer模块和全局子值池化模块;
将目标域图像集分别输入所述第一行人重识别网络模型和第二行人重识别网络模型中,利用所述每个行人重识别网络模型中的所述卷积神经网络进行处理,利用所述Transformer模块提取全局信息,得到中间特征;
所述利用所述每个行人重识别网络模型中的所述卷积神经网络进行处理,利用所述Transformer模块提取全局信息,得到中间特征包括:
将所述目标域图像集输入所述每个行人重识别网络模型中,利用所述卷积神经网络进行处理,并进行空间维度展平得到特征f,将所述特征f附上cls标记得到特征fcls,并对所述特征fcls进行位置编码得到特征fcp;
将所述特征fcp输入所述Transformer模块中,利用所述Transformer模块进行处理并进行转置和维度扩展,得到所述中间特征F;
将所述中间特征输入所述全局子值池化模块中,利用所述全局子值池化模块进行池化处理,输出最终特征值,并进行聚类分析,得到所述每个行人重识别网络模型的硬伪标签;
所述将所述中间特征输入所述全局子值池化模块中,利用所述全局子值池化模块进行池化处理,输出最终特征值,并进行聚类分析,得到所述每个行人重识别网络模型的硬伪标签包括:
将所述中间特征F输入所述全局子值池化模块中,提取所述全局子值池化模块任一通道的特征Fc,将所述特征Fc中的n个值进行降序排序,选取其中最大的k个值,进行加权求和得到中间特征
重复上述步骤得到所述全局子值池化模块中所有通道的中间特征将所述所有通道的中间特征进行拼接得到所述最终特征利用所述最终特征进行聚类,生成所述硬伪标签;
其中∑pi≡1,1≤k≤n,{s1,s2,...,sn}为降序排序结果;
构建所述每个行人重识别网络模型的时序平均模型,将所述目标域图像集分别输入每个时序平均模型中,得到每个时序平均模型软伪标签;
利用所述硬伪标签和所述软伪标签对所述第一行人重识别网络模型和第二行人重识别网络模型进行协同训练;
选取两个时序平均模型中mAP精度值大的模型作为目标行人重识别网络模型。
2.如权利要求1所述的方法,其特征在于,所述Transformer模块衍生于visiontransformer模型中的模块结构。
3.如权利要求1所述的方法,其特征在于,所述构建所述每个行人重识别网络模型的时序平均模型,将所述目标域图像集分别输入每个时序平均模型中,得到所述每个时序平均模型软伪标签包括:
根据E(T)[Θ]=αE(T-1)[Θ]+(1-α)Θ分别构建第一时序平均模型和第二时序平均模型;
将所述目标域图像集分别输入所述第一时序平均模型和所述第二时序平均模型中进行分类,得到第一软伪标签和第二软伪标签;
其中,Θ为行人重识别网络模型的参数,E[Θ]为时序平均模型的参数,T为整个目标域阶段的迭代次数且E(0)[Θ]=Θ,α为范围在[0,1)之间的超参数。
4.如权利要求3所述的方法,其特征在于,所述利用所述硬伪标签和所述软伪标签对所述第一行人重识别网络模型和第二行人重识别网络模型进行协同训练包括:
S61:利用所述第一行人重识别网络模型的软硬伪标签与所述第二行人重识别网络模型的预测结果计算损失,优化所述第一行人重识别网络模型;
S62:利用所述第二行人重识别网络模型的软硬伪标签与所述第一行人重识别网络模型的预测结果计算损失,优化所述第二行人重识别网络模型;
S63:重复步骤S61和步骤S62,直至达到预设训练阈值;
S64:判断所述第一时序平均模型和所述第二时序平均模型的mAP精度值,选取时序平均模型mAP精度高的模型作为所述目标行人重识别网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210181439.3/1.html,转载请声明来源钻瓜专利网。