[发明专利]一种基于自适应度惩罚和社区信息的预测网络连边的方法在审
申请号: | 201810994602.1 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109255376A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 杨旭华;杨旭华;肖杰 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社区信息 聚类系数 自适应 惩罚 预测 网络 社区 建立网络模型 相似性分数 相似性指标 计算网络 降序排列 网络集群 算法 邻居 | ||
一种基于自适应度惩罚和社区信息的预测网络连边的方法,建立网络模型,使用社区划分算法把网络划分为若干个社区,计算各个节点的聚类系数,计算网络的平均聚类系数,计算二者之间的相似性指标,根据节点间的连边是内部连边还是社区间的连边来反映社区信息的影响,将所有无连边节点对之间的相似性分数按降序排列,取前h个指标对应的两个节点为预测连边。本发明利用了共同邻居的最佳惩罚程度与网络集群系数之间存在关系,使用网络的平均聚类系数使度惩罚自适应,提取了社区信息,有效利用了网络的相关性信息,预测精度较高。
技术领域
本发明涉及网络与链路预测领域,特别是指一种基于自适应度惩罚和社区信息的预测网络连边的方法。
背景技术
网络在我们身边随处可见,从生物系统,到交通运输网络;从熟知的互联网,到邮政网、电视信号网络,它几乎覆盖了我们学习、工作、生活等各个方面。上网进行学习,资料的查询等工作上的需要,找工作,买房子,购物等生活上的需要,看电影,旅游的定制等娱乐上的需要。越来越多的人通过互联网来获取外界信息,从而了解社会动态。实际生活中我们互相间的交流构成了社交网络,网上不断的购物形成了电子商务的网络,交通出行构成了交通网络。大数据和深度学习的研究进一步促进了网络的发展,也为我们的生活提供了更多的便利。
近年来,随着网络科学的快速发展,其理论上的成果为链路预测搭建了一个研究的平台,使得链路预测的研究与网络的结构与演化紧密联系起来。链路预测是基于网络中节点属性,拓扑信息,相关社区信息等来预测复杂网络中任意两个未连接节点的链接概率。在社交网络,电子商务,数据挖掘和生物网络等各式各样的网络中都可以创造可观的价值。链路预测主要是基于网络的拓扑结构给出我们的相似性分数算法,再根据AUC或Precision指标与其他经典算法如CN、RA和AA等进行比较判断算法的优劣性。对于链路预测算法,我们不仅要考虑其精确性,考虑其计算复杂度也是很有必要的,随着网络规模和数据量的不断增大,算法所需的时间也不断增加,如何将算法的精确度和计算复杂度结合起来是十分重要的。
发明内容
为了克服现有预测网络连边的方法的获取网络信息不全面、预测精度较低、的不足,为了更全面地获取网络信息,提升现有算法的预测性能,本发明提出一种准确性较高的一种基于自适应度惩罚和社区信息的的预测网络连边的方法。
本发明解决其技术问题所采用的技术方案是:
一种基于自适应度惩罚和社区信息的预测网络连边的方法,包括如下步骤:
步骤一:构建具有N个节点的无向网络G(V,E),V为节点,E为连边,其邻接矩阵用A表示,它是一个N×N的二维数组,若两个节点i和j之间存在连边则Aij为1,反之为0;
步骤二:使用社区划分算法把网络G划分为若干个社区,其中一个社区指的是网络中具有相似属性一类节点及其连边所构成的子网;
步骤三:计算整个网络的平均聚类系数:
其中,Cx是节点的聚类系数:
其中Γ(x)为节点x的邻居集合,ey,z为节点x邻居间的连边;
步骤四:任意选取网络G中两个无连边的节点i和j,i和j之间的公共相邻节点称为它们的共同邻居,计算节点i,j间的相似性指标
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810994602.1/2.html,转载请声明来源钻瓜专利网。