[发明专利]一种基于KNN的有效链路预测方法在审
申请号: | 202010132439.5 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111310849A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 李龙杰;王辉;单娜;陈晓云 | 申请(专利权)人: | 兰州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04;G06Q50/00 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 杨保刚 |
地址: | 730000 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 knn 有效 预测 方法 | ||
本发明公开了一种基于KNN的有效链路预测方法,涉及链路预测领域,通过选定节点对的局部特征,计算未知节点对与已知有边及无边节点对的特征距离,来得到未知节点对的相似性分数,继而预测未知节点对存在链路的可能性,不需要知道特定网络中的节点属性,就可以进行链路预测,解决了节点的特征属性难以获得,而现有技术中需要获得节点的特征属性才能进行链路预测的问题,且方法易操作易计算,对存在的有效链路能较好的预测,且普适性高。
技术领域
本发明涉及链路预测领域,特别涉及一种基于KNN的有效链路预测方法。
背景技术
随着以社交网络为代表的大型复杂网络的出现,复杂网络分析的研究也随之得到了迅速的发展。在复杂网络的研究中,寻找潜在的未知链路问题我们称之为链路预测问题。链路预测目前应用领域有很多。
而近年来随着对链路预测研究的不断深入,科学家通过从网络中提取不同的网络特征,而后采用马尔可夫链和机器学习技术进行链路预测实验,并取得了不错的效果。但是,这些方法表现效果取决于在特定网络中获得的节点属性,例如在社交网络中的文本特征。然而,节点的特征属性通常是隐藏的,因此人们很难获得它们。
发明内容
本发明的目的在于:提供了一种基于KNN的有效链路预测方法,通过选定节点对的局部特征,计算未知节点对与已知有边及无边节点对的特征距离,来得到未知节点对的相似性分数,继而预测未知节点对存在链路的可能性,不需要知道特定网络中的节点属性,就可以进行链路预测,解决了节点的特征属性难以获得,而现有技术中需要获得节点的特征属性才能进行链路预测的问题。
本发明采用的技术方案如下:
一种基于KNN的有效链路预测方法,主要包括依次进行的以下步骤,
步骤1:在网络中选取测试集和训练集,其中训练集分为有边训练集和无边训练集,选取网络中至少一个重要特征,对训练集中的节点对分别构造特征向量;
步骤2:每给出一个测试节点对时,对测试节点对构造相同的特征向量,并分别计算与两个训练集中节点对的向量距离,取距离最小的前K组节点对,生成中心特征向量;
步骤3:分别计算测试节点对与有边节点对中心特征向量及无边节点对中心特征向量的距离;
步骤4:运用TOPSIS方法,得到测试节点对有边可能性分数。
进一步地,所述步骤1中选取的重要特征为五个,分别是两个节点的共同邻居的数量CN、基于资源分配的思想而提出的链路预测相似性指标RA、一条边连接到一个节点的概率正比于该节点的度PA、共同邻居CN的基础上考虑两端节点度的影响JC、两节点路径长度为3的路径个数3-hop。
进一步地,假设网络中的两个节点为vi和vj,vi通过它们的共同邻居向vj传递资源,ki、Kj分别是节点vi、vj的度,则所述五个重要特征CN、RA、PA、JC和3-hop分别表示为:
(a)两个节点的共同邻居的数量CN:
两个节点具有的共同邻居数越多,它们就越相似,则节点vi、vj的CN相似性特征值定义为:
SimCN(vi,vj)=|Γ(vi)∩Γ(vj)| (1)
(b)基于资源分配的思想而提出的链路预测相似性指标RA:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州大学,未经兰州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010132439.5/2.html,转载请声明来源钻瓜专利网。