[发明专利]基于无监督联合多损失模型的跨域行人重识别方法有效
申请号: | 202010143811.2 | 申请日: | 2020-03-04 |
公开(公告)号: | CN111126360B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 田玉敏;杨芸;吴自力;王笛;潘蓉 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/74;G06V10/82;G06N3/088;G06N3/0464 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;黎汉华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 联合 损失 模型 行人 识别 方法 | ||
1.一种基于无监督联合多损失模型的跨域行人重识别方法,其特征在于,包括如下:
1)从公开网站获取无标签的目标域数据集和有标签的源域数据集,在目标域数据集中随机选取一部分图片作为测试集,并将测试集分为查询集与候选集,将目标域数据集中剩余的图片和源域数据集中的图片作为训练集;
2)将训练集中的图片依次进行翻转,裁剪,随机擦除的数据预处理,并将预处理后的训练集中的图片通过跨摄像头风格迁移进行扩充;将训练集的图片统一到相同尺寸;
3)选取残差网络作为基准网络模型,初始化网络参数,调整该基准网络结构;
4)构建目标域损失函数:
4a)对目标域数据集中每个样本图片的特征采用余弦距离进行度量,根据距离由大到小排序,选择前k个图片作为样本近邻,对每个图片的近邻赋予权重wi,j:
其中,i为样本编号,j为样本近邻编号,k为近邻个数,xt,i是目标域样本图片,M(xt,i,k)为样本图片k个近邻的编号的集合;
4b)根据权重wi,j,构建目标域损失函数Ltgt:
其中,是训练集中随机采样的图片,nt是批训练目标域图片的数目,是图片属于近邻j的概率;
5)将目标域损失函数与现有的源域损失函数、三元组损失函数进行融合得到总的损失函数L:
L=λ1Lsrc+λ2Ltgt+λ3LT
其中,Lsrc为源域损失函数,LT为三元组损失函数,λ1为源域损失函数所占比例的权重值,λ2为目标域损失函数所占比例权重值,λ3为三元组损失函数所占比例权重值;
6)将训练集图片输入到残差网络中,利用总损失函数L对残差网络进行训练并优化训练过程,得到训练好的残差网络模型;
7)将查询集和候选集中的图片输入到训练好的残差网络模型中进行特征提取,将查询集中的目标图片的特征与候选集中的图片特征分别计算欧式距离,并对计算的欧式距离进行排序,在候选集中选取与查询集中目标距离最近的图片作为识别结果。
2.根据权利要求1所述的方法,其特征在于,2)中利用循环生成对抗网络进行跨摄像头风格迁移,将目标域数据集中不同摄像头拍摄的图片输入到循环生成对抗网络中,得到摄像头视角转换后的图片,并将转换后的图片连同转换前的图片一起加入到目标域数据集中,以对数据集进行扩充。
3.根据权利要求1所述的方法,其特征在于,3)中利用迁移学习,使用在ImageNet上预训练好的模型参数对残差网络进行初始化,调整残差网络结构,实现如下:
3a)去除残差网络最后一个全连接层,加上一个4096维的输出全连接层;
3b)在4096维的输出全连接层后依次添加归一化处理层、线性整流函数层、随机丢弃层和两个组件,其中第一个组件是源域数据的分类模块,包括一个M维的全连接层和激活函数层;第二个组件是一个目标域的样本存储器模块,该样本存储器是一个键值对结构,拥有键存储槽和值存储槽,键具有唯一性,键存储槽用于存储图片特征,值存储槽用于存储图片的输入编号。
4.根据权利要求1所述的方法,其特征在于,4)中的余弦距离,是将两个特征向量相乘并除以两个特征向量模的乘积,余弦距离越大,则两个特征向量夹角越小,两个特征向量越接近,反之,则越远。
5.根据权利要求1所述的方法,其特征在于,5)中所述的源域损失函数,采用交叉熵损失函数,其公式如下:
式中,i为样本编号,m为训练批量中源域图片的数目,xs,i为源域样本图片,ys,i为xs,i样本携带的标签信息,p(ys,i|xs,i)是xs,i属于ys,i的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010143811.2/1.html,转载请声明来源钻瓜专利网。