[发明专利]一种基于HSIC和RKHS子空间学习的域自适应方法在审
申请号: | 202011167557.6 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112287811A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 詹增荣;余明辉;杨鹏;马争鸣 | 申请(专利权)人: | 广州番禺职业技术学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N20/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;颜希文 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hsic rkhs 空间 学习 自适应 方法 | ||
本发明提出一种基于希尔伯特‑斯密特独立性准则和再生核希尔伯特空间子空间学习的域自适应方法。本发明把源域数据集和目标域数据集变换到一个再生核希尔伯特空间,然后再投影到再生核希尔伯特空间的一个子空间,子空间按照源域数据集和目标域数据集之间的希尔伯特‑斯密特独立性准则最大化确定。子空间确定后,在子空间里利用源域数据的已知类别识别目标域数据类别。本发明基于希尔伯特‑斯密特独立性准则和再生核希尔伯特空间子空间学习,构建了一个利用证件照片上的人脸(源域数据)识别抓拍照片上的人脸(目标域数据)的人脸识别系统,能够提高人脸识别得到准确率。
技术领域
本发明属于机器学习领域,尤其涉及一种基于希尔伯特-斯密特独立性准则(Hilbert-Schmidt Independence Criterion,简称HSIC)和再生核希尔伯特空间(Reproducing Kernel Hilbert Subspace,简称RKHS)子空间学习的的域自适应方法。
背景技术
机器学习中的域自适应问题是指存在二个数据集,分别称为源域数据集和目标域数据集,源域数据是有标签的数据,而目标域数据是没有标签的数据。我们需要利用源域数据的标签识别目标域数据的标签。但是,源域数据集和目标域数据集在数据空间的分布是不同的,如果直接在数据空间进行识别,必然会造成较大误差。这个问题,就是所谓域自适应学习的问题。
域自适应学习的一个典型例子就是公安局保存的证件照(源域数据)和视频监控获取的抓拍照(目标域数据)。证件照中的人脸一般都是姿态正面、表情中性,而抓拍照中的人脸姿态各异、表情丰富。因此,证件照和抓拍照在图像空间的分布是不同的。证件照中人脸的身份是已知的,而抓拍照中人脸的身份是未知的,我们需要利用证件照中人脸的身份识别抓拍照中人脸的身份。
域自适应问题的一个解决办法就是把数据从数据空间变换到一个在数据空间上定义的RKHS,然后再投影到RKHS的一个子空间,通过选择子空间,使得源域数据集和目标域数据集变换到RKHS的子空间后,它们的概率分布能够尽量接近。
在实际应用中,源域数据集和目标域数据集的分布是不知道的,因此无法衡量源域数据集和目标域数据集变换到RKHS子空间后,它们的概率分布是否接近。目前常用的方法是利用它们的统计特征来近似衡量它们概率分布接近的程度,例如常用的最大均值差异准则。
HSIC衡量二个随机变量的统计相关性,但是,HSIC不是直接衡量这二个随机变量的统计相关性,而是先把这二个随机变量变换到二个RKHS,然后利用这二个RKHS之间Hilbert-Schmidt算子衡量二个变换后的随机变量的统计相关性。在实际应用中,我们可以把二个服从不同分布的数据集看成是二个随机变量的样本,然后根据样本平均逼近统计平均的原则,计算这二个数据集的HSIC。
发明内容
设(H,k)表示一个在数据空间Ω上定义的RKHS,其中k表示H的再生核,设表示源域数据集,表示目标域数据集,利用k把Xs和Xt变换到H:
这里φ(x)=k(·,x)∈H。
进一步,我们利用φ(Xs)和φ(Xt)构造H的子空间如下:
用{θ1,…,θd}张成H的子空间如下:
显然,子空间span{θ1,…,θd}完全由组合系数矩阵W决定:
N=Ns+Nt
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州番禺职业技术学院,未经广州番禺职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011167557.6/2.html,转载请声明来源钻瓜专利网。