[发明专利]一种数据处理方法及装置有效
申请号: | 201810859161.4 | 申请日: | 2018-07-31 |
公开(公告)号: | CN109165679B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 许明微;李琳;吴耀华 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张荣;张颖玲 |
地址: | 100032 北京市西城区德*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
根据源域图像在对齐后的空间中的聚集程度确定最优对齐矩阵,使得所述源域图像中属于相同类别的第一源域图像,在对齐后的空间中的聚集程度最大;
利用所述最优对齐矩阵将所述源域图像的子空间和目标域图像的子空间对齐,得到源域图像数据集和目标域图像数据集;
根据所述源域图像数据集和所述目标域图像数据集对最近邻分类器进行训练,得到训练后的分类器;
利用训练后的分类器对所述目标域图像中不带标签的图像进行分类识别;
其中,通过下述公式(5)构建所述最优对齐矩阵的表达式:
其中,λ,β∈(0,+∞]表示正则化常数,表示源域图像的子空间和目标域图像的子空间的分布差异,Sw表示源域图像中属于相同类别的第一源域图像在对齐后的空间中的聚集程度;Sb表示源域图像中属于不同类别的第二源域图像在对齐后的空间中的分散程度;M表示最优对齐矩阵;λtr(Sw)为矩阵Sw的迹,βtr(Sb)为矩阵Sb的迹,Ps表示源域图像子空间,Pt表示目标域图像子空间;
其中,通过下述公式(1)构建矩阵Sw;通过下述公式(2)构建矩阵Sb:
令:
其中,C表示源域样本S和目标域样本T在原始空间中所属的类别个数;ni表示第i类样本的个数;μi表示第i类样本的均值;μ表示所有样本的均值;Ps表示源域子空间;M表示源域子空间Ps和目标域子空间Pt的对齐矩阵;表示具体某个样本;上标T表示矩阵的转置。
2.根据权利要求1所述的方法,所述方法还包括:
根据源域图像在对齐后的空间中的聚集程度确定最优对齐矩阵,使得所述源域图像中属于不同类别的第二源域图像,在对齐后的空间中的聚集程度最小。
3.根据权利要求1所述的方法,根据源域图像在对齐后的空间中的聚集程度确定最优对齐矩阵,使得所述源域图像中属于相同类别的第一源域图像,在对齐后的空间中的聚集程度最大,包括:
计算最优对齐矩阵,使得所述源域图像中第i类图像的均值和所述源域图像中所有图像的均值之间的差异最小。
4.根据权利要求2所述的方法,根据源域图像在对齐后的空间中的聚集程度确定最优对齐矩阵,使得所述源域图像中属于不同类别的第二源域图像,在对齐后的空间中的聚集程度最小,包括:
计算最优对齐矩阵,使得所述源域图像中第i类图像的均值和所述源域图像中所有图像的均值之间的差异最大。
5.根据权利要求1所述的方法,根据源域图像在对齐后的空间中的聚集程度确定最优对齐矩阵,包括:
构建所述源域图像中属于相同类别的第一源域图像在对齐后的空间中的第一散布矩阵,所述第一散布矩阵表征所述第一源域图像在对齐后的空间中的最大聚集程度;
构建所述源域图像中属于不同类别的第二源域图像在对齐后的空间中的第二散布矩阵,所述第二散布矩阵表征所述第二源域图像在对齐后的空间中的最小聚集程度;
根据所述第一散布矩阵和所述第二散布矩阵,确定所述最优对齐矩阵。
6.根据权利要求1所述的方法,其特征在于,在根据源域图像在对齐后的空间中的聚集程度确定最优对齐矩阵之前,所述方法还包括:
利用主成分分析法PCA分别对原始空间中的所述源域图像和所述目标域图像进行降维处理,得到所述源域图像的子空间和所述目标域图像的子空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810859161.4/1.html,转载请声明来源钻瓜专利网。