[发明专利]基于分组遗传算法的链路预测方法有效
申请号: | 201410081745.5 | 申请日: | 2014-03-06 |
公开(公告)号: | CN103905246B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 吴建设;焦李成;王芳;马晶晶;马文萍;李阳阳;于昕 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 西安智萃知识产权代理有限公司61221 | 代理人: | 李东京 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分组 遗传 算法 预测 方法 | ||
技术领域
本发明属于模型评价领域,涉及网络的链路预测,具体的说是一种新的基于分组遗传算法的链路预测方法,可用于对网络的演化模型进行评价。
背景技术
链路预测通俗的讲是根据网络中已知连边的结构信息以及这些节点的属性来预测网络中那些不存在连接的节点对之间建立连边的可能性的大小。链路预测包括两类:一类是对真实存在但是尚未被发现的连边的预测;另一类是对那些现在不存在,但是在将来有可能存在的连边的预测。
链路预测问题之所以引起众多领域的研究者的广泛关注,是因为其具有重大的实用价值。如酵母菌的新陈代谢网络中80%的新陈代谢作用还没有被我们发现,如果我们能够根据已知的新陈代谢作用和酵母菌的节点属性等相关信息预测出其他的还未被发现的新陈代谢作用,并依据这些作用来指导实验验证这些作用,这将大大减少实验的时间和花费,对了解整个酵母菌的性能产生巨大的推动作用。真实网络的实验数据中通常都含有噪声,这些噪声影响了网络的真实连接,可能使网络中产生一些虚假的连边或则是丢失了一部分连边,通过链路预测的方法,可以有针对性的对这些连边进行实验,而不需要将全部的连边都考虑在实验中,这样就避免了盲目而无意义的实验。
链路预测问题不仅具有重大的实际应用价值,而且对复杂网络的理论的建立和完善起到推动和借鉴的作用。连边预测可以用来理解、揭示和比较动态网络内在的演化机制。比如,判断提供网络演化机制的模型的预测准确性。实际上在社会网络的分析和传输过程中也会遇到数据不全或则传输出错的问题,链路预测的方法可以在这种情况下作为准确分析社会网络结构有力的辅助工具。
因其重要的实用价值和理论研究价值,国内外目前对复杂网络的链路预测方向上的研究也越来越多。早期的链路预测是数据挖掘领域的一个研究分支,主要是基于概率模型和机器学习的方法来进行研究。Sarukkai于2000年首先用马尔科夫链的方法对web网站上用户浏览和访问路径的网络进行了路径分析和预测。随后,Zhu等人将马尔科夫链的方法扩展到了自适应网站中。节点的属性信息随后也被应用到链路预测中,并且这种预测方法取得了很好的预测效果。但是很多情况下节点的属性信息是很难获得的,或则说是不可能得到的。另外获得的节点的属性信息并不完全是真实的。相对于节点的属性信息;来说,网络的结构或则说用户的历史信息是容易获得且十分可靠的。Liben-Nowell和Kleinberg等人根据网络的拓扑结构特性提出了相似性的方法。相似性的方法主要分为两类,一类是基于节点的相似性的方法,另一类是基于路径的相似性的方法。基于相似性的方法的关键在于如何定义节点之间的相似性。近年来,相似性的方法已经取得了不错的研究成果。
基于网络拓扑结构的最大似然估计方法也是解决链路预测问题中的一个重要突破。Clauset,Moore和Newman指出网络节点之间的连接可以看做是某种内在的层次结构的反映,并提出了层次结构模型的方法。通过实验证明这种方法在具有明显层次结构的网络中预测精度较高;但是,这种方法每次预测时都必须要生成很大的网络样本集,因此它的计算复杂度非常高,只适合用来处理一些规模不太大的网络。此外,还有一类方法是利用随机分块模型来进行相关预测,它不仅可以预测出网络中的缺失连边,还可以预测出错误的连边。随机分块模型的方法虽然取得了很好的预测效果,但是同样由于计算复杂度的关系,使其不能够应用于规模较大的网络。
发明内容
本发明的目的在于针对已有链路预测方法的不足,提出一种基于分组遗传算法的链路预测方法,以提高预测的精度和速度。
为实现上述目的,本发明的技术方案是:一种基于分组遗传算法的链路预测方法,其特征在于:包含如下步骤:
(1)参数的初始化:根据需要预测的具体网络确定网络的节点个数N、种群大小M=100及种群迭代次数P=200、移除的边的比例Pr,其中Pr取(0,1)中的任何一个值;
(2)确定训练集ET和测试集EP,得到观测矩阵A0:载入网络的连边数据集,计算出整个网络的连边数n,从网络的连边数据集中随机抽取[n×Pr+0.5]条边,其中[]表示取整数,这些边所组成的集合即为测试集EP,网络的连边数据集除去测试集EP之外作为训练集ET;先初始化观测矩阵A0为一个N×N的全零矩阵,依次遍历训练集ET中的所有边,并将这些边在观测矩阵A0中对应的元素改成1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410081745.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种真空进料V型混合机
- 下一篇:一种抗挤压复合电缆