[发明专利]一种多源异构数据的聚类方法及装置在审
申请号: | 201811593400.2 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109919172A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 杨天若;赵雅靓;孙佳宇 | 申请(专利权)人: | 华中科技大学鄂州工业技术研究院;华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 436044 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征空间 聚类 矩阵 多源异构数据 对象相似度 聚类结果 属性组合 因子矩阵 组合向量 预设 奇异值分解 多源异构 关系属性 排名算法 高阶 构建 算法 分解 融合 | ||
本发明实施例提供的一种多源异构数据的聚类方法,该方法包括:针对特征空间的多源异构特性,融合特征空间构建对象张量与特征空间组合向量,特征空间为一个以上;根据所述对象张量,获得对应的特征转移张量;采用预设的多关系属性组合排名算法对所述特征转移张量进行处理,获得对应的属性组合排名张量;采用预设的高阶奇异值分解算法对对象张量及所述属性组合排名张量进行分解,获得对应的核心张量与因子矩阵;根据特征空间组合向量、核心张量与所述因子矩阵进行计算,获得对应的对象相似度矩阵;根据不同特征空间下的对象相似度矩阵进行聚类,获得多聚类结果。该方法解决了现有技术中聚类结果难以解释的问题。
技术领域
本发明涉及数据处理及物联网技术领域,具体而言,涉及一种多源异构数据的聚类方法及装置。
背景技术
随着云计算、物联网、社交网络和社会新媒体等高新信息技术的飞速发展,现实世界大量的感知设备、智能产品、网络通信,以及人类知识、思维能力、社会关系和文化元素,从多个维度产生了大规模的多源异构数据,这些数据具有特征混杂、模态多样、类型复杂等特点,并在不同的视图下蕴含着不同的知识和价值。在许多实际应用中,数据被收集用于多个分析任务,可根据不同需求对数据聚类从而产生不同的分组。
多聚类作为数据挖掘的一个新兴研究领域,近年来受到各领域学者和业界的极大关注。相对于只关注发现对象单一分组的传统单聚类,多聚类可以从数据的不同观点产生多个不同的聚类结果,多方面揭示隐藏在数据中的不同结构,同时满足当今大数据多分析任务的需求。通过多聚类技术开发可以促使人们更加全面挖掘现实世界对象的复杂关系,为开展高效准确的多分析任务提供技术方法。多聚类是解决网络舆情分析、重大疾病分析、资源推荐和金融风险预测等众多应用问题的关键技术,在我囯社会、工业和经济领域有着迫切的需求,具有广阔的应用前景。
现有的一些聚类方法可达到多聚类效果,但聚类结果难以解释,无法根据灵活的变化聚类对象,难以为不同的应用提供按需服务。
发明内容
有鉴于此,本发明实施例的目的在于提供一种多源异构数据的聚类方法及装置,解决了现有技术中聚类结果难以解释的问题,还可根据上下文情境变化灵活的聚类对象,达到了为不同的应用提供按需服务的效果。
第一方面,本申请通过一实施例提供如下技术方案:
一种多源异构数据的聚类方法,用于对多源异构数据进行聚类,所述方法包括:
针对特征空间的多源异构特性,融合特征空间构建对象张量与特征空间组合向量,所述特征空间为一个以上;
根据所述对象张量,获得对应的特征转移张量;
采用预设的多关系属性组合排名算法对所述特征转移张量进行处理,获得对应的属性组合排名张量;
采用预设的高阶奇异值分解算法对所述对象张量及所述属性组合排名张量进行分解,获得对应的核心张量与因子矩阵;
根据所述特征空间组合向量、所述核心张量与所述因子矩阵进行计算,获得对应的对象相似度矩阵;
根据不同特征空间组合下的所述对象相似度矩阵进行聚类,获得多聚类结果。
优选地,所述根据所述对象张量,获得对应的特征转移张量的步骤,包括:
将所述对象张量中的非零元素转化为1后进行累加,获得对应的关联张量;
对所述关联张量的每一阶进行归一化处理,获得对应的特征转移张量。
优选地,所述采用预设的多关系属性组合排名算法对所述特征转移张量进行处理,获得对应的属性组合排名张量的步骤,包括:
根据预设的阈值参数、初始向量、随机向量、初始化概率参数以及所述特征空间对应的所述特征转移张量,获得属性排名向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811593400.2/2.html,转载请声明来源钻瓜专利网。