[发明专利]基于引力相似度的图聚类方法在审
申请号: | 201810550210.6 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108764356A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 周红芳;张懿辉;刘艺彬 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 涂秀清 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似度 聚类 引力 计算目标函数 矩阵 目标函数 隶属度 更新 初始聚类中心 时间复杂度 无向带权图 度数 方法更新 分类属性 划分结果 属性特征 拓扑结构 综合考虑 构建 算法 | ||
本发明公开的基于引力相似度的图聚类方法,主要目的是提升节点包含分类属性的无向带权图的聚类效果。具体步骤包括:首先构建目标函数,然后选取k个度数最大的节点作为初始聚类中心计算各节点与簇中心的引力相似度来更新隶属度矩阵得到最初的划分,并计算目标函数值,再在每个簇中根据簇中心更新方法更新簇中心,然后更新隶属度矩阵并计算目标函数值,直到目标函数值不再改变时,算法停止该划分为最终划分结果。本发明公开的基于引力相似度的图聚类方法,解决了现有方法没有综合考虑图的拓扑结构、节点的属性特征以及时间复杂度较高的问题。
技术领域
本发明属于数据挖掘方法技术领域,涉及一种基于引力相似度的图聚类方法。
背景技术
图是一种非常重要的数据结构,它可以形象地描述数据对象之间的关系,所以它经常被用来描述如人际关系网络、流行病传播网络、传感器网络和蛋白质网络等复杂网络的拓扑结构。图聚类技术可以有效地发现复杂网络中的社团结构,从而帮助研究者更好地理解复杂网络的特征和功能,预测复杂网络的演变规律。图聚类和传统的聚类最主要的区别在于,图聚类中节点的相似性不仅取决于图的拓扑结构而且还和节点之间的属性相似性有关,而传统的聚类中数据对象的相似性只取决于数据对象之间的属性相似性。图聚类算法实现两个目标:(1)同一个子图内的节点紧密相连,与其它子图的连接比较稀疏;(2)相似的节点应该被划分到同一个子图中,不相似的节点应该被划分到不同的子图中。
在一个图中,节点之间的联系构成了图的拓扑,节点的属性反映了节点的特征。图聚类就是根据图的拓扑和节点的特征将一个大图划分成若干个子图的过程,如果一个图聚类算法只考虑拓扑结构或者节点的特征,那么它将在聚类过程中丢失掉图的许多信息。然而大多数算法只关注于拓扑结构或者节点特征中的一个,而很少有算法将拓扑结构和节点特征结合起来。研究者已经提出了许多图聚类算法,并且已经将它们成功地应用在复杂网络中。大多数算法都只考虑到了网络的拓扑结构而忽视了网络中的节点特征。Tian等人提出了一种基于OLAP模式(OLAP-style)的算法,这种算法忽视了簇内的拓扑结构。Zhou等人提出统一距离方法(unified distance measure),这种算法的时间复杂度非线性增长,当属性很多时,该算法的时间复杂度将会很高。
发明内容
本发明的目的是提供一种基于引力相似度的图聚类方法,解决了现有方法聚类效果差以及时间复杂度较高的问题。
本发明所采用的技术方案是,基于引力相似度的图聚类方法,聚类的图为节点包含分类属性的无向带权图,定义为:一个节点包含分类属性的无向带权图可以用一个三元组表示G={V,A,E},其中,V={v1,v2,...,vn}为包含n个节点的非空集合,每个节点包含m个分类属性;A={a1,a2,...,am}为m个属性的非空集合,属性aj的值域为它是有限并且无序的;E={(vi,vj)|vi,vj∈V}是无向边的集合,节点vi与vj边的权值wij>0;
具体操作过程包括如下步骤:
步骤1.构建目标函数F(W,Z);
步骤2.选取k个度数最大的节点作为初始聚类中心得到中心点矩阵Z(1),计算各个节点与所有簇中心之间的引力相似度计算隶属度矩阵得到W(1)并计算目标函数值F(W(1),Z(1)),设置迭代次数t=1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810550210.6/2.html,转载请声明来源钻瓜专利网。