[发明专利]一种基于样本选择的域自适应降维方法在审
申请号: | 201910225963.4 | 申请日: | 2019-03-25 |
公开(公告)号: | CN110110739A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 马争鸣;光毓;刘希 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及机器学习中域自适应相关问题,提出了一种基于样本选择的域自适应降维算法。为了减少源域和目标域之间的数据分布差异,学习一个降维矩阵,把源域和目标域数据投影到一个低维子空间中。首先在源域和目标域样本中寻找一个子集,该子集中的样本是对衡量域间数据分布差异比较重要的样本,把这些样本叫做地标样本,利用地标样本匹配域间差异。在对投影矩阵进行优化时,本发明把投影矩阵看做是格雷斯曼流形上的点,把在欧式空间中的约束优化问题转化为格雷斯曼流形上的无约束优化问题,利用格雷斯曼流形上的共轭梯度法求解投影矩阵。交替优化投影矩阵和地标样本直至达到最大迭代次数,使域间差异达到最小。 | ||
搜索关键词: | 样本 投影矩阵 目标域 自适应 地标 降维 流形 源域 数据分布 样本选择 域间 子集 无约束优化问题 矩阵 低维子空间 共轭梯度法 差异比较 机器学习 数据投影 优化问题 匹配域 迭代 求解 算法 优化 衡量 转化 学习 | ||
【主权项】:
1.一种基于样本选择的域自适应降维方法,其特征在于:A.令
和
分别表示源域和目标域数据样本,其中Ns表示源域样本个数,Nt表示目标域样本个数,D为高维空间的维度;Xs和Xt具有不同且相关的数据分布;学习投影矩阵W,把源域和目标域数据共同映射到一个低维的潜在子空间,通过匹配降维后源域和目标域之间的类条件概率分布和边缘概率分布差异,得到源域和目标域数据在低维子空间中相应的数据表示
和
其中d(d<<D)为低维空间的维度;用最大均值差异(MaximumMeanDiscrepancy简称MMD)测量域间的分布差异,源域和目标域间的边缘概率分布差异记为MMDu(Ys,Yt);为目标域数据添加伪标签,源域和目标域间类条件概率分布差异为MMDc(Ys,Yt),最小化源域和目标域之间的边缘概率分布和类条件概率分布差异;B.用MMD衡量域间差异时,并不是用源域和目标域中所有样本数据,而是在源域和目标域分别定义指示向量α和β,用于选择部分样本作为地标样本,地标样本指那些对衡量域间差异比较重要的关键样本;选择地标样本后,再用MMD衡量域间边缘概率分布差异Du(α,β,W,Ys,Yt),类条件概率分布差异DC(α,β,W,Ys,Yt),为使得所选取的样本不至于使得样本类别失衡,加入类均衡的限制条件;得到目标函数:![]()
对指示向量α、β及W交替进行优化,对α、β的求解转化为二次规划问题,对W的求解转化为格雷斯曼流形上的优化问题,利用格雷斯曼流形上的共轭梯度法求解;得到最终的W后,对于源域和目标域的输入数据,得到降维表示Ys和Yt。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910225963.4/,转载请声明来源钻瓜专利网。