[发明专利]一种基于流行距离核的迁移谱聚处理方法在审
申请号: | 201910691192.8 | 申请日: | 2019-07-29 |
公开(公告)号: | CN110503134A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 齐晓轩;董海;卞永钊;周兆元;刘英英;都丽 | 申请(专利权)人: | 沈阳大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 21205 沈阳技联专利代理有限公司 | 代理人: | 张志刚<国际申请>=<国际公布>=<进入 |
地址: | 110044 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于流行距离核的迁移谱聚处理方法,涉及一种相似性度量聚类处理方法,该方法针对目标域数据匮乏或或者是结构复杂等问题,提出一种学习方法可以有效利用源域知识提高目标域的聚类性能,传统相似性度量方法是基于欧式距离,缺点是无法反映聚类数据的复杂空间结构。因此本发明公开了一种基于流形距离核的迁移谱聚类的数据处理方法。该方法既充分考虑样本聚类的全局一致性和复杂的空间分布特征,又包含了数据分布的局部结构,且利用迁移学习方法可充分挖掘源域与目标域的潜在联系,利用源域的知识辅助目标域聚类,从而在整体上提高了数据集的聚类性能。 | ||
搜索关键词: | 聚类 目标域 源域 相似性度量 迁移 复杂空间结构 空间分布特征 辅助目标 局部结构 聚类处理 聚类数据 欧式距离 数据分布 样本聚类 数据处理 数据集 流形 挖掘 学习 全局 | ||
【主权项】:
1.一种基于流行距离核的迁移谱聚处理方法,其特征在于,所述方法包括如下处理步骤:/n步骤1 从源域中选取目标域的可参照样本:/n步骤1.1对输入目标域数据集 和源域数据集 ,使用第K近邻机制,从源域挑选出目标域任一个样本的一可参照样本,选取方法采用网格搜索法,形成新的可参照样本集;/n步骤2 计算源域数据的加权局部密度自适应的流行距离核的相似度矩阵 :/n步骤2.1通过迪杰特斯拉算法对源域任意两点数据 和 之进行最短路径选择,并计算最短路径和 ;/n步骤2.2计算源域数据集参数 ,其中 , ;/n步骤2.3计算 ,该项可以对相似度矩阵准确性进行调整;SNN为共享近邻的个数,当两个点的共享最近邻的点的个数多,则 值大,当共享近邻点的个数少时, 的值小;当共享近邻数为0时, ,即对相似性不做调整;/n步骤2.4计算源域的相似度矩阵相似度矩阵 ;/n步骤3. 源域数据的新的特征矩阵 :/n步骤3.1计算源域数据的拉普拉斯矩阵 ,其中对角元素为: ,/n构造对角矩阵: ,构造拉普拉斯矩阵: ,拉普拉斯矩阵标准化:/n ;/n步骤3.2 对 进行特征分解取前k个最小特征值对应的特征向量 ,并标准化得源域数据的新的特征矩阵 ;/n步骤4 计算目标域数据的加权局部密度自适应的流行距离核的相似度矩阵 :/n步骤4.1通过迪杰特斯拉算法对源域任意两点数据 和 之进行最短路径选择,并计算最短路径和 ;/n步骤4.2计算源域数据集参数 ,其中 , ;/n步骤4.3计算 ,该项可以对相似度矩阵准确性进行调整;SNN为共享近邻的个数,当两个点的共享最近邻的点的个数多,则 值大,当共享近邻点的个数少时, 的值小;当共享近邻数为0时, ,即对相似性不做调整;/n步骤4.4计算目标域的相似度矩阵相似度矩阵:/n ;/n步骤5计算目标域的拉普拉斯矩阵 ,其中对角元素为: ,/n构造对角矩阵: ,构造拉普拉斯矩阵: ,拉普拉斯矩阵标准化:/n ;/n步骤6计算拉普拉斯 ,对拉普拉斯矩阵进行特征分解,取前k个最小特征值组成新的特征矩阵 ;/n步骤9将 的每一行看成是 空间内的一点,使用模糊c均值算法(FCM)或其它聚类算法将其聚为c类。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳大学,未经沈阳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910691192.8/,转载请声明来源钻瓜专利网。