[发明专利]一种基于样本选择的域自适应降维方法在审

申请号：	201910225963.4	申请日：	2019-03-25
公开（公告）号：	CN110110739A	公开（公告）日：	2019-08-09
发明（设计）人：	马争鸣;光毓;刘希	申请（专利权）人：	中山大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及机器学习中域自适应相关问题，提出了一种基于样本选择的域自适应降维算法。为了减少源域和目标域之间的数据分布差异，学习一个降维矩阵，把源域和目标域数据投影到一个低维子空间中。首先在源域和目标域样本中寻找一个子集，该子集中的样本是对衡量域间数据分布差异比较重要的样本，把这些样本叫做地标样本，利用地标样本匹配域间差异。在对投影矩阵进行优化时，本发明把投影矩阵看做是格雷斯曼流形上的点，把在欧式空间中的约束优化问题转化为格雷斯曼流形上的无约束优化问题，利用格雷斯曼流形上的共轭梯度法求解投影矩阵。交替优化投影矩阵和地标样本直至达到最大迭代次数，使域间差异达到最小。
搜索关键词：	样本投影矩阵目标域自适应地标降维流形源域数据分布样本选择域间子集无约束优化问题矩阵低维子空间共轭梯度法差异比较机器学习数据投影优化问题匹配域迭代求解算法优化衡量转化学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于样本选择的域自适应降维方法，其特征在于：A.令和分别表示源域和目标域数据样本，其中N_s表示源域样本个数，N_t表示目标域样本个数，D为高维空间的维度；X_s和X_t具有不同且相关的数据分布；学习投影矩阵W，把源域和目标域数据共同映射到一个低维的潜在子空间，通过匹配降维后源域和目标域之间的类条件概率分布和边缘概率分布差异，得到源域和目标域数据在低维子空间中相应的数据表示和其中d(d＜＜D)为低维空间的维度；用最大均值差异(MaximumMeanDiscrepancy简称MMD)测量域间的分布差异，源域和目标域间的边缘概率分布差异记为MMD_u(Y_s,Y_t)；为目标域数据添加伪标签，源域和目标域间类条件概率分布差异为MMD_c(Y_s,Y_t)，最小化源域和目标域之间的边缘概率分布和类条件概率分布差异；B.用MMD衡量域间差异时，并不是用源域和目标域中所有样本数据，而是在源域和目标域分别定义指示向量α和β，用于选择部分样本作为地标样本，地标样本指那些对衡量域间差异比较重要的关键样本；选择地标样本后，再用MMD衡量域间边缘概率分布差异D_u(α,β,W,Y_s,Y_t)，类条件概率分布差异D_C(α,β,W,Y_s,Y_t)，为使得所选取的样本不至于使得样本类别失衡，加入类均衡的限制条件；得到目标函数：对指示向量α、β及W交替进行优化，对α、β的求解转化为二次规划问题，对W的求解转化为格雷斯曼流形上的优化问题，利用格雷斯曼流形上的共轭梯度法求解；得到最终的W后，对于源域和目标域的输入数据，得到降维表示Y_s和Y_t。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910225963.4/，转载请声明来源钻瓜专利网。

上一篇：一种基于多特征融合的雷达辐射源识别方法
下一篇：基于多时间尺度特征和神经网络的钻进过程工况识别方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于样本选择的域自适应降维方法在审

专利文献下载