[发明专利]一种基于结构化词典域转移的交叉视角人脸识别方法有效
申请号: | 201410583963.9 | 申请日: | 2014-10-27 |
公开(公告)号: | CN104318214B | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 陈雪;王春恒;肖柏华 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于结构化词典域转移的交叉视角人脸识别方法,其包括步骤S1将训练出每个对样本类别有区分性的子词典串接构成结构化的源域词典;S2学习目标域和多个中间域词典;S3对源域及目标域的图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到并分别将源域及目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征和目标域人脸图像的域共享特征;S4根据源域人脸图像的域共享特征,对源域人脸集中的每一类样本训练一个支持向量机模型;将目标域人脸图像的域共享特征输入所有类别的支持向量机模型,取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。 | ||
搜索关键词: | 一种 基于 结构 词典 转移 交叉 视角 识别 方法 | ||
【主权项】:
一种基于结构化词典域转移的交叉视角人脸识别方法,特征在于,该方法包括以下步骤:步骤S1:根据源域人脸集的人脸图像特征,对源域人脸集中的每一类样本训练出每个对样本类别有区分性的子词典;所有类的子词典串接在一起,构成结构化的源域词典;步骤S2:通过递增地减少源域词典在目标域人脸集上的重构误差,逐渐地将源域词典转移到目标域,同时学习目标域词典和多个中间域词典;步骤S3:计算源域人脸集的人脸图像在源域词典上的源域图像人脸编码,对源域图像人脸编码、源域词典、目标域词典和多个中间域词典分别计算,得到源域人脸图像的源域重构图像、目标域重构图像和中间域重构图像;将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征;计算目标域人脸集的人脸图像在目标域词典上的目标域图像人脸编码,分别对目标域图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像,将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征;步骤S4:根据源域人脸图像的域共享特征,对源域人脸集中的每一类样本训练一个支持向量机模型;将目标域人脸图像的域共享特征输入所有类别的支持向量机模型,取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别;其中,训练出源域词典中每个对样本类别有区分性的子词典的步骤如下:步骤S11:为了使源域词典能有效的构建源域人脸集模型,将源域词典在源域人脸集上的重构误差进行最小化并构建出最小化目标函数:步骤S12:为了使结构化的源域词典能够区分源域人脸集中的每一类样本,构建源域词典中的每个子词典与源域人脸集中对应的第i类样 本的重构能力约束项和区分性约束项模型;步骤S13:结合最小化目标函数、重构能力约束项和区分性约束项,构建新目标函数;步骤S14:通过对源域词典及其稀疏编码系数矩阵迭代更新来求解新目标函数,训练出源域词典中每个子词典;所述最小化目标函数表示为:其中,ES为源域词典在源域人脸集上的重构误差,XS为源域人脸集YS在所有类的子词典串接构成的结构化的源域词典D上的稀疏编码系数矩阵,s.t表示优化条件;为稀疏编码系数矩阵XS的第l列,l为稀疏编码系数矩阵XS的列的序号;||.||0表示l0范数为统计向量中的非零元素个数;T0是稀疏编码的稀疏水平参数;i为源域人脸集中样本类别序号,C为源域人脸集中样本类别数目;Di为源域词典中第i类样本的子词典;构建所述约束项模型的步骤包括如下:步骤S121:每个子词典对源域人脸集中的第i类样本集YiS具有良好的重构能力的约束项表示为:所述良好的重构能力是重构误差越小重构能力越好;步骤S122:第i类样本的子词典对源域人脸集中每类样本集具有良好的区分性约束项r(Di)表示为:所述良好的区分性是约束项r(Di)越小区分性越好;其中,Di为源域人脸集中第i类样本的子词典,为第i类样本集YiS对应子词典Di的稀疏编码系数矩阵,是重构误差,i为源域人脸集中样本类别序号,C为源域人脸集中样本类别数目;为第j类样本集对应子词典Di的稀疏编码系数矩阵;所述构建新的目标函数J表示为:其中,XS为源域人脸集YS在所有类的子词典串接构成的结构化的源域词 典D上的稀疏编码系数矩阵,YiS为第i类样本集,Di为源域人脸集中第i类样本的子词典,为第i类样本集YiS对应子词典Di的稀疏编码系数矩阵,r(Di)表示为子词典Di对源域人脸集中每类样本集的区分性约束项,α为正的惩罚参数,表示F2范数;i为源域人脸集中样本类别序号,C为源域人脸集中样本类别数目;求解所述源域词典及其稀疏编码系数矩阵的步骤包括:步骤S141:设定源域词典的取值,将新目标函数简化为标准的稀疏编码问题;利用追踪算法对标准的稀疏编码进行求解,得到最优解的稀疏编码系数矩阵;所述追踪算法为匹配追踪或正交匹配追踪算法;步骤S142:设定稀疏编码系数矩阵XS的取值,将第i类样本的子词典依据以下的子问题依次更新:通过令新目标函数J0对于源域词典中第i类样本的子词典Di的一阶导数为零,得到源域词典中第i类样本的子词典Di的闭集解;迭代更新源域词典和稀疏编码系数矩阵;当迭代次数达到预设迭代次数T0时,迭代终止;其中为第i类样本集YiS对应子词典Di的稀疏编码系数矩阵;r(Di)表示子词典Di对源域人脸集中每类样本集的区分性约束项,α为正的惩罚参数;所述学习目标域词典和多个中间域词典的具体步骤为:步骤S21:依据稀疏表示的原则,通过最小化第k个中间域词典在目标域人脸集Yt上的重构误差来求解第k个稀疏编码系数矩阵Xt(k),对稀疏编码系数矩阵Xt(k)进行优化的目标函数表示为:其中,D(k)为给定的第k个中间域词典,k为中间域词典的序号;Xt为待求解的稀疏编码系数矩阵;s.t表示优化条件;l为稀疏编码系数矩阵Xt的列的序号;为稀疏编码系数矩阵Xt的第l列;||.||0表示l0范数,统计向量中的非零元素个数;T0是稀疏编码的稀疏水平参数;以上优化目标通过追踪算法求解;步骤S22:将稀疏编码系数矩阵Xt(k)写做Xt(k)={X1t(k),X2t(k),...,XCt(k)},其中Xit(k)为目标域人脸集Yt对第i类样本的子词典Di(k)的稀疏编码系数矩阵,那么重构误差可以分解为:其中,Ei表示去除子词典Di(k)后,目标域人脸集Yt在中间域词典D(k)上的重构误差;Xjt(k)为目标域人脸集Yt对第j类样本的子词典Dj(k)的稀疏编码系数矩阵;j≠i;为了最小化重构误差Et,优化子词典Di(k)使得它能拟合当前的残余重构误差Ei,同时,为了惩罚相邻的中间域词典间的突变,限制相邻词典的增量ΔDi(k)=Di(k+1)‑Di(k)要小,Di(k+1)为子词典Di(k)的更新值;最终,优化目标函数表示为:其中,λ为正的惩罚参数;步骤S23:假设ωi为目标域人脸集Yt中使用子词典Di(k)作为重构元素的样本的序号索引集其中,Nt为目标域人脸集的样本总数,Xit(k)为目标域人脸集Yt对子词典Di(k)的稀疏编码系数矩阵,l为Xit(k)的列的序号,设Ωi为Nt×|ωi|大小的收缩矩阵,且收缩矩阵Ωi中坐标为(ωi(l),l)的元素的值Ωi(ωi(l),l)=1,收缩矩阵Ωi中其余值为0;定义稀疏编码系数矩阵Xit(k)的收缩矩阵为目标域人脸集Yt的收缩矩阵为重构误差Ei的收缩矩阵为则步骤S22中的优化目标函数J1等价于:步骤S24:通过对Di(k+1)和迭代更新来求解目标函数J1;给定通过令目标函数J1对于参数Di(k+1)的一阶导数为零来求解Di(k+1);给定Di(k+1),通过令目标函数J1对于参数的一阶导数为零求来求解的更新值迭代更新参数当相邻词典的增量ΔDi(k)小于某一预设阈值T1时,迭代操作终止,学习得到多个中间域词典迭代更新算法得到的最后一个词典定义为目标域词典DK; 其中K为学习目标域词典和多个中间域词典的总数,K‑1为中间域词典的个数,k为中间域词典的序号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410583963.9/,转载请声明来源钻瓜专利网。