[发明专利]一种基于流行距离核的迁移谱聚处理方法在审
申请号: | 201910691192.8 | 申请日: | 2019-07-29 |
公开(公告)号: | CN110503134A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 齐晓轩;董海;卞永钊;周兆元;刘英英;都丽 | 申请(专利权)人: | 沈阳大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 21205 沈阳技联专利代理有限公司 | 代理人: | 张志刚<国际申请>=<国际公布>=<进入 |
地址: | 110044 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 目标域 源域 相似性度量 迁移 复杂空间结构 空间分布特征 辅助目标 局部结构 聚类处理 聚类数据 欧式距离 数据分布 样本聚类 数据处理 数据集 流形 挖掘 学习 全局 | ||
1.一种基于流行距离核的迁移谱聚处理方法,其特征在于,所述方法包括如下处理步骤:
步骤1 从源域中选取目标域的可参照样本:
步骤1.1对输入目标域数据集和源域数据集,使用第K近邻机制,从源域挑选出目标域任一个样本的一可参照样本,选取方法采用网格搜索法,形成新的可参照样本集;
步骤2 计算源域数据的加权局部密度自适应的流行距离核的相似度矩阵:
步骤2.1通过迪杰特斯拉算法对源域任意两点数据和之进行最短路径选择,并计算最短路径和;
步骤2.2计算源域数据集参数,其中,;
步骤2.3计算,该项可以对相似度矩阵准确性进行调整;SNN为共享近邻的个数,当两个点的共享最近邻的点的个数多,则值大,当共享近邻点的个数少时,的值小;当共享近邻数为0时,,即对相似性不做调整;
步骤2.4计算源域的相似度矩阵相似度矩阵;
步骤3. 源域数据的新的特征矩阵:
步骤3.1计算源域数据的拉普拉斯矩阵,其中对角元素为:,
构造对角矩阵:,构造拉普拉斯矩阵:,拉普拉斯矩阵标准化:
;
步骤3.2 对进行特征分解取前k个最小特征值对应的特征向量,并标准化得源域数据的新的特征矩阵;
步骤4 计算目标域数据的加权局部密度自适应的流行距离核的相似度矩阵:
步骤4.1通过迪杰特斯拉算法对源域任意两点数据和之进行最短路径选择,并计算最短路径和;
步骤4.2计算源域数据集参数,其中,;
步骤4.3计算,该项可以对相似度矩阵准确性进行调整;SNN为共享近邻的个数,当两个点的共享最近邻的点的个数多,则值大,当共享近邻点的个数少时,的值小;当共享近邻数为0时,,即对相似性不做调整;
步骤4.4计算目标域的相似度矩阵相似度矩阵:
;
步骤5计算目标域的拉普拉斯矩阵,其中对角元素为:,
构造对角矩阵:,构造拉普拉斯矩阵:,拉普拉斯矩阵标准化:
;
步骤6计算拉普拉斯,对拉普拉斯矩阵进行特征分解,取前k个最小特征值组成新的特征矩阵;
步骤9将的每一行看成是空间内的一点,使用模糊c均值算法(FCM)或其它聚类算法将其聚为c类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳大学,未经沈阳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910691192.8/1.html,转载请声明来源钻瓜专利网。