[发明专利]一种基于数据转换之间保持最大依赖关系的域自适应降维方法在审

专利信息
申请号: 201711060524.X 申请日: 2017-10-25
公开(公告)号: CN107818345A 公开(公告)日: 2018-03-20
发明(设计)人: 马争鸣;欧阳效源;刘洁;刘希;刘耀辉;王鑫 申请(专利权)人: 中山大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及机器学习中域自适应相关问题,提出了一种基于数据转换之间保持最大依赖关系的域自适应降维方法。为了减少源域与目标域之间的分布差异性,本方法对数据进行两次再生核希尔伯特空间映射,这两个希尔伯特空间分别记为H1和H2,其中H2被称为源域与目标域共同的潜在空间。为了方便测量源域与目标域之间边缘分布的差异性,本发明使用最大均值差异(MMD)的方法实现测量。H2由H1映射得来,为了测量数据映射在H1和H2空间中的相关性,本发明使用了希尔伯特‑施密特独立准则(HSIC)方法测量。本方法的主要目的是使得源域和目标域在H2中的分布差异最小化,即MMD值最小化,且在H1和H2空间中数据转换之间的依赖关系最大化,即HSIC值最大化。
搜索关键词: 一种 基于 数据 转换 之间 保持 最大 依赖 关系 自适应 方法
【主权项】:
一种基于数据转换之间保持最大依赖关系的域自适应降维方法,其特征在于:A.令X表示数据样本的特征空间,X=XS∪XT={xi|i=1,…,N}表示N个样本的训练数据集,其中XS表示源域数据样本,XT表示目标域数据样本,并且XS与XT具有不同的边缘概率分布;通过核映射的方法,把源域和目标域的样本共同映射到希尔伯特再生核空间H1=span{φ(x1),...,φ(xN)},即把X映射到H1中,H1中的φ(x1),...,φ(xN)分别对应X中的N个样本;然后在H1中,通过内积的计算方式得到核矩阵K;定义一个转移矩阵,表示为W,把H1映射到再生核希尔伯特空间H2,把φ(xi)映射到H2,得到H2中的投影同样地,通过内积的计算方式得到核矩阵L;在H2中计算投影后的源域与目标域的分布差异,用最大均值差异(MMD)测量,记为MMD(XS,XT);前面的操作过程进行了两次核映射变换,为了最大化保持前后两次映射的依赖关系,这里添加了一个正则项,使用希尔伯特‑施密特独立准则(HSIC)测量H1和H2的前后的依赖性,记为HSIC(H1,H2),H1与H2的HSIC值为其中CN表示中心化矩阵;然后得到无监督的目标函数:argminW,MMD(XS,XT)+μ·tr(WTW)-λ·HSIC(H1,H2)s.t.WKWT=Id]]>对于任意的输入样本点x,令kx=[k(x1,x) k(x2,x) … k(xn,x)]T,x的降维表示为B.进一步地,令Y表示样本的类别空间,Y表示与X对应的类别集合,yi∈{1,2,…,c},nl表示Y中值为l的元素个数,则源域的类内距离可以表示为与步骤A所述相结合,得到半监督的目标函数:argminWMMD(XS,XT)+μ·tr(WTW)-λ·HSIC(H1,H2)+α·In(XS)s.t.WKWT=Id]]>对于任意的输入样本点x,令kx=[k(x1,x) k(x2,x) … k(xn,x)]T,x的降维表示为
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711060524.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top