[发明专利]基于低秩先验引导的域不变信息分离的行人重识别方法有效
申请号: | 202010424961.0 | 申请日: | 2020-05-19 |
公开(公告)号: | CN111783521B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 李华锋;李玲莉;余正涛;张亚飞 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/46;G06V10/74;G06V10/764;G06V10/772;G06K9/62 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 李筱 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 先验 引导 不变 信息 分离 行人 识别 方法 | ||
1.一种基于低秩先验引导的域不变信息分离的行人重识别方法,其特征在于:包括如下步骤:
首先,提出低秩成分分解的字典学习模型,将不同相机视角下的行人图像特征,分解成具有低秩特性的风格信息和具有判别性的行人信息,通过将分解出来的风格信息去除,利用剩下的行人信息来训练判别字典学习模型,并将行人信息在其对应字典下的判别系数作为行人的潜在身份特征,用于行人身份判别性度量的依据;
其次,在字典学习模型内,嵌入了属性与特征关联模块,挖掘属性与特征之间的关系,构建从特征到属性的映射,搭建源域与目标域之间的桥梁,在字典学习模型中引入了自重构约束以及身份判别特征与标签一致性约束;
最后,通过选择信任度高的伪标记样本来更新模型,使其更适应目标域数据的识别;
具体步骤如下:
步骤1,问题定义:和分别为源域和目标域内的特征样本集合,s表示源域,t表示目标域,n和m分别表示相机视角个数,v和h表示源域和目标域中的第v个和第h个摄像头,nv和nh分别表示源域和目标域中每个摄像头下的样本个数,源域中第v个视角下nv个样本集合表示为目标域中第h个视角下的nh个未标记样本集合表示为和分别表示源数据集和目标数据集的语义属性,其中和表示源域中第i个摄像头下ni个样本的属性和目标域中第j个摄像头下nj个样本的属性,Ys为源域样本的标签集合,在源域中Xs,Ys,As是给定的,而在目标域中,只有视觉特征Xt是给定的,提出方法的主要任务之一是使用在源域中训练的模型来预测目标域的属性At,从而实现对目标域标签Yt的预测;
步骤2,域不变分离模型的建立:根据相同视角下行人图像风格的低秩先验性,建立如下的域不变信息分离模型:
其中,分别为行人风格特征和行人身份特征在风格字典D∈Rm×d和身份特征字典下的编码系数,di∈Rm和d0,j∈Rm分别为D的第i个原子和D0的第j个原子,Csc是每个摄像头下行人风格特征编码系数的集合,Cs是每个摄像头下行人身份特征编码系数的集合,||·||*是矩阵的核范数,λ1,γ和α1为平衡参数,公式(1)的第一项表示仅用D0来重构行人图像的身份特征,第二项表示用D来重构剩余的图像风格特征,第三和第五项是低秩正则项,由于同一视角下,表达域信息的关键成分是由成像风格引入的,具有低秩性,这类信息在字典D下具有相似的编码系数,而且能使用相同的原子来表达,因此使用正则化编码系数由于原始视觉特征是由编码系数和其对应的字典重构得到的,这里将编码系数称之为潜在的特征;
步骤3,利用有标记且携带属性的训练样本来构建域不变的潜在特征和属性之间的映射关系,能实现目标域样本属性的预测,便于综合利用属性和域不变特征进行行人身份的确定,为此,在公式(1)的基础上,提出如下的字典学习模型:
其中,T表示的是转置,表示的是源数据集第v个摄像头下行人的属性,W为关系矩阵,其作用是将反映行人身份的潜在特征空间和属性空间关联起来,β为平衡参数,公式2中,利用了自重构的思想来保证行人身份的潜在特征和属性的一致性;
步骤4,利用标签信息建立如下字典学习模型:
其中,σ和σ1为平衡参数,表示第v个视角下的行人标签,为充分挖掘已标记样本的标签信息,使能起到分类器的作用,因此引入正则项来达到这一目的,最小化是为防止过拟合;
步骤5,让无标记的目标域内部分样本参与到模型的训练中:
其中,λ2和α2是平衡参数,分别是目标数据集样本在字典D∈Rm×d和下的编码系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010424961.0/1.html,转载请声明来源钻瓜专利网。