[发明专利]一种多源异构数据的聚类方法及装置在审
申请号: | 201811593400.2 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109919172A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 杨天若;赵雅靓;孙佳宇 | 申请(专利权)人: | 华中科技大学鄂州工业技术研究院;华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 436044 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征空间 聚类 矩阵 多源异构数据 对象相似度 聚类结果 属性组合 因子矩阵 组合向量 预设 奇异值分解 多源异构 关系属性 排名算法 高阶 构建 算法 分解 融合 | ||
1.一种多源异构数据的聚类方法,其特征在于,用于对多源异构数据进行聚类,所述方法包括:
针对特征空间的多源异构特性,融合特征空间构建对象张量与特征空间组合向量,所述特征空间为一个以上;
根据所述对象张量,获得对应的特征转移张量;
采用预设的多关系属性组合排名算法对所述特征转移张量进行处理,获得对应的属性组合排名张量;
采用预设的高阶奇异值分解算法对所述对象张量及所述属性组合排名张量进行分解,获得对应的核心张量与因子矩阵;
根据所述特征空间组合向量、所述核心张量与所述因子矩阵进行计算,获得对应的对象相似度矩阵;
根据不同特征空间组合下的所述对象相似度矩阵进行聚类,获得多聚类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述对象张量,获得对应的特征转移张量的步骤,包括:
将所述对象张量中的非零元素转化为1后进行累加,获得对应的关联张量;
对所述关联张量的每一阶进行归一化处理,获得对应的特征转移张量。
3.根据权利要求1所述的方法,其特征在于,所述采用预设的多关系属性组合排名算法对所述特征转移张量进行处理,获得对应的属性组合排名张量的步骤,包括:
根据预设的阈值参数、初始向量、随机向量、初始化概率参数以及所述特征空间对应的所述特征转移张量,获得属性排名向量;
将所述属性排名向量做外积,获得对应的属性组合排名张量。
4.根据权利要求3所述的方法,其特征在于,所述获得属性排名向量的步骤,包括:
将所述特征转移张量与所述随机向量交互做模积,获得对应的目标向量及所述目标向量对应的误差,其中,每个所述特征转移张量对应一所述随机向量;
若当前所述目标向量与相邻的两个所述目标向量的误差之和小于阈值参数,则将当前所述目标向量作为所述特征转移张量对应的属性排名向量。
5.根据权利要求1所述的方法,其特征在于,根据所述特征空间组合向量、所述核心张量与所述因子矩阵进行计算,获得对应的对象相似度矩阵的步骤,包括:
根据所述特征空间组合向量、所述核心张量与所述因子矩阵做模积,获得近似属性组合排名张量;
根据所述近似属性组合排名张量与近似对象张量进行公式构建,获得排名张量距离公式;
采用所述排名张量距离公式计算对象张量间的相似度,获得所述对象相似度矩阵。
6.根据权利要求5所述的方法,其特征在于,所述距离公式为:
其中drtd为排名张量距离,fn为第n个特征空间的属性维度,mst为排名张量距离中度量矩阵的元素,rs为排名张量中第s个位置的元素,ob[x]s为对象张量x在第s个位置的元素,ob[y]s为对象张量y在第s个位置的元素,rt为排名张量中第t个位置的元素,ob[x]t为对象张量x在第t个位置的元素,ob[y]t为对象张量y在第t个位置的元素。
7.根据权利要求1所述的方法,其特征在于,所述根据不同特征空间组合下的所述对象相似度矩阵进行聚类,获得多聚类结果的步骤包括:
将所述对象相似度矩阵作为仿射传播聚类算法的输入,获得多聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811593400.2/1.html,转载请声明来源钻瓜专利网。