[发明专利]一种基于局部相似性的链路预测方法在审
申请号: | 201910335553.5 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110084423A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 胡越;肖婧;许小可 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 盖小静 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社团 局部相似性 相似性指标 链路预测 测试集 邻居 初始种群 划分结果 降序排列 结构信息 原始种群 负样本 正样本 等大 构建 链接 算法 种群 集合 预测 申请 网络 | ||
本发明公开了一种基于局部相似性的链路预测方法,具体步骤如下:S1.获取原始种群数据并构建初始种群;S2.从不存在连边的节点对列表中选取与测试集正样本等大的连边集合作为测试集负样本;S3.采用InfoMap算法获得种群个体对应的社团划分;S4.根据社团划分结果获取社团内连边及社团外连边的节点对列表;S5.从网络中的第一节点对开始,根据节点对的共同邻居数量,依次计算每对节点的共同邻居相似性指标CN,将所有不存在连边按照CN值降序排列,则排在前L条的连边最有可能存在链接;本申请通过加入社团结构信息的相似性指标,使预测准确性得到大大提升。
技术领域
本发明涉及一种链路预测方法,具体说是一种基于局部相似性的链路预测方法。
背景技术
链路预测和社团检测是复杂网络研究中的两个重要方向。网络中的链路预测是指通过已知节点以及节点之间的连边等信息,预测网络中尚未产生连边的两个节点可能存在连边或者将产生连边的可能性。若将社会中实体及实体之间的相互关系抽象为网络形式——实体即节点,相互关系即连边,那么链路预测在其中具有巨大的应用价值。链路预测算法能够识别未知的相互作用,从而达到降低试验成本的目的。例如,在生物领域,蛋白质间绝大多数的相互作用都是未知的,研究人员需要花费大量时间和金钱探究其中未知的相互作用。链路预测算法能够帮助分析社交网络的演变过程,例如,可以利用在线社交网络的历史结构,预测两个素不相识的人将来是否会成为朋友。链路预测还可以帮助我们分析各种网络的网络结构,衡量网络模型对应真实网络的适应度。另外,链路预测算法在推荐算法的设计和虚假链接检测问题中也有重要作用,例如,在甄别得到的链接中,可以根据算法的结果对错误连接进行改正,从而更好的实现网络重建及优化。
作为复杂网络研究方向之一,链路预测在计算机领域已有较为深入的研究。利用节点属性信息进行链路预测的方法可以得到很好的预测准确性。
然而与节点属性信息相比,网络的局部信息比较容易获取,并且比节点属性信息更可靠。因此,学者们随后提出了一系列基于局部信息的链路预测方法,其中包括基于节点相似度、基于网络拓扑结构和基于网络层次结构的链路预测方法。基于节点相似度的链路预测方法认为两个节点的相似度越大,那么他们之间出现连边的可能性越大,给出一个合理的指标来衡量节点相似度是非常重要的。其中共同邻居算法CN假设:如果两个节点有更多的共同邻居,那么它们连接的可能性更大。在共同邻居的基础上,Adamic-Adar指标和Resourse-Allocation指标考虑了两个节点共同邻居的度的信息,这两种基于节点相似度的指标也常用于链路预测。在利用网络拓扑结构进行链路预测这方面,Madadhain利用网络的拓扑结构信息和节点属性建立了一个局部条件概率模型进行预测,同时使用了机器学习的技术增加预测精度。
在实际应用中,多数情况下很难获得节点属性等外部信息,比如大多数在线系统的用户信息都是保密的。另外,也不能确定获取的信息是否能够真实的反映节点情况、哪些信息对于反映节点的真实情况是有用的,也就是很难保证节点属性信息的可靠性。而在基于网络层次等链路预测的方法中,往往需要生成很多样本网络,因此只能处理规模较小的网络。
发明内容
本申请提供了一种链路预测方法,通过加入社团结构信息的相似性指标,使预测准确性得到大大提升。
为实现上述目的,本申请的技术方案为:一种基于局部相似性的链路预测方法,具体步骤如下:
S1.获取原始种群数据并构建初始种群,并获取不存在连边的节点对列表;
S2.随机选取种群中10%的连边作为测试集正样本,剩余90%的连边作为训练集,从不存在连边的节点对列表中选取与测试集正样本等大的连边集合作为测试集负样本;
S3.采用InfoMap算法获得种群个体对应的社团划分;
S4.根据社团划分结果获取社团内连边及社团外连边的节点对列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910335553.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理