[发明专利]一种基于流行距离核的迁移谱聚处理方法在审
申请号: | 201910691192.8 | 申请日: | 2019-07-29 |
公开(公告)号: | CN110503134A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 齐晓轩;董海;卞永钊;周兆元;刘英英;都丽 | 申请(专利权)人: | 沈阳大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 21205 沈阳技联专利代理有限公司 | 代理人: | 张志刚<国际申请>=<国际公布>=<进入 |
地址: | 110044 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 目标域 源域 相似性度量 迁移 复杂空间结构 空间分布特征 辅助目标 局部结构 聚类处理 聚类数据 欧式距离 数据分布 样本聚类 数据处理 数据集 流形 挖掘 学习 全局 | ||
一种基于流行距离核的迁移谱聚处理方法,涉及一种相似性度量聚类处理方法,该方法针对目标域数据匮乏或或者是结构复杂等问题,提出一种学习方法可以有效利用源域知识提高目标域的聚类性能,传统相似性度量方法是基于欧式距离,缺点是无法反映聚类数据的复杂空间结构。因此本发明公开了一种基于流形距离核的迁移谱聚类的数据处理方法。该方法既充分考虑样本聚类的全局一致性和复杂的空间分布特征,又包含了数据分布的局部结构,且利用迁移学习方法可充分挖掘源域与目标域的潜在联系,利用源域的知识辅助目标域聚类,从而在整体上提高了数据集的聚类性能。
技术领域
本发明涉及涉及一种相似性度量聚类处理方法,特别是涉及一种基于流行距离核的迁移谱聚处理方法。
背景技术
聚类方法是一种运用广泛的探索性数据分析技术,人们对数据产生的第一直觉往往是通过对数据进行有意义的分组。但是在面对领域中可用数据的匮乏或者采集数据中存在大量的复杂结构等问题时,传统的聚类算法很难达到良好的效果,所以近年来,迁移学习引起了广泛的关注和研究。迁移学习是运用已存在的知识对不同但相关领域问题进行求解的一种新的机器学习方法,通俗的理解为:一个人要是学会了自行车,学习自行车的经验就会帮助他更容易学会开摩托车;一个人要是熟悉五子棋,也可以将学习五子棋的知识迁移到学习围棋中,帮助学习五子棋。所以迁移学习方法可以在一定程度上有效利用在某个领域上学习到的知识或模式(源域的数据和知识)指导当前不同但相关领域中数据的聚类任务,从而提高聚类性能。所以如何利用迁移学习提高聚类性能,很多研究人员提出了一些解决方法:发表的文献主要包括《科学与探索》的域间F-范数正则化迁移谱聚类方法,《控制与决策》的知识qia难以极大熵聚类算法等。
申请号为CN201210384176.2的专利,一种具备迁移学习能力的模糊聚类图像分割方法。这种迁移学习方法主要通过来自源域的高级知识迁移,数据迁移,源域聚类中心和基于历史隶属度的知识迁移等。
上述迁移聚类方法虽然利用已知的源域知识能够帮助提高目标域的聚类效果,但是没有考虑数据聚类复杂的空间分布特性,皆是以欧式距离作为相似性度量方法,对于一些特殊分布的数据集,却达不到理想效果。于是在欧式距离的基础上,流行距离被提出,这种距离测度提高了对一些特殊数据集的聚类效果。
发明内容
本发明的目的在于提供一种基于流行距离核的迁移谱聚处理方法,本发明在域间F-范数正则化迁移谱聚类方法的基础上,使用流形距作为相似性度量方法,对其迁移谱聚类算法中的源域与目标域数据的相似性矩阵W进行改进,提出了一种基于流行距离核的迁移谱聚类的数据处理方法。该方法可以充分考虑数据聚类的复杂的空间分布特性,且有已知历史数据辅助,比原始谱聚类方法聚类效果更加准确、可靠。
本发明的目的是通过以下技术方案实现的:
一种基于流行距离核的迁移谱聚处理方法,所述方法包括如下处理步骤:
步骤1 从源域中选取目标域的可参照样本:
步骤1.1对输入目标域数据集和源域数据集,使用第K近邻机制,从源域挑选出目标域任一个样本的一可参照样本,选取方法采用网格搜索法,形成新的可参照样本集;
步骤2 计算源域数据的加权局部密度自适应的流行距离核的相似度矩阵:
步骤2.1通过迪杰特斯拉算法对源域任意两点数据和之进行最短路径选择,并计算最短路径和;
步骤2.2计算源域数据集参数,其中,;
步骤2.3计算,该项可以对相似度矩阵准确性进行调整;SNN为共享近邻的个数,当两个点的共享最近邻的点的个数多,则值大,当共享近邻点的个数少时,的值小;当共享近邻数为0时,,即对相似性不做调整;
步骤2.4计算源域的相似度矩阵相似度矩阵;
步骤3. 源域数据的新的特征矩阵:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳大学,未经沈阳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910691192.8/2.html,转载请声明来源钻瓜专利网。