[发明专利]一种融合多模体信息的有向网络链路预测方法在审
申请号: | 201910764256.2 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110493045A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 许小可;刘亚芳;毕学良 | 申请(专利权)人: | 大连民族大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 21235 大连智高专利事务所(特殊普通合伙) | 代理人: | 毕进<国际申请>=<国际公布>=<进入国 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 初始网络 测试集 链路预测 有向网络 正样本 模体 邻居 使用机器 随机选取 负样本 训练集 角色 等大 多模 构建 双模 叠加 集合 融合 申请 应用 学习 | ||
1.一种融合多模体信息的有向网络链路预测方法,其特征在于,包括如下步骤:
S1.通过原始有向网络数据构建初始网络,并获取不存在连边的节点对列表;
S2.随机选取初始网络数据中10%的连边作为测试集正样本,剩余90%的连边作为训练集,从不存在连边的节点对列表中选取与测试集正样本等大的连边集合作为测试集负样本;
S3.采用朴素贝叶斯模型算法获得初始网络中个体对应的角色函数值;
S4.从初始网络中的第一节点对开始,根据节点对的共同邻居,得到每一节点对所对应的共同邻居的角色函数Rw列表;
S5.从初始网络中的第一节点对开始,依次计算每对节点的共同邻居相似性指标CN,得到节点对的共同邻居数量;
S6.根据节点对的共同邻居数量和节点对所对应的共同邻居的角色函数得到节点对的r'xy列表;
S7.根据单个模体r'xy列表通过叠加的方式得到双模体的rxy的列表;或者将不同的单个模体得到的r'xy列表使用机器学习的方法XGBoost得到新的score列表。
2.根据权利要求1所述一种融合多模体信息的有向网络链路预测方法,其特征在于,使用XGBoost的方法计算所有模体之间的相关性,根据模体之间的相关性进行双模体链路预测的模体选择。
3.根据权利要求1所述一种融合多模体信息的有向网络链路预测方法,其特征在于,共同邻居相似性指标CN的计算方法为:针对无向无权网络,用Γ(a)表示节点a的邻居,Γ(b)表示节点b的邻居,则:
CN(a,b)=|Γ(a)∩Γ(b)|
节点a和节点b的相似性指标等于节点a的邻居节点与节点b的邻居节点重叠数量,即节点a和节点b的共同邻居数量;
进而得出,针对有向无权网络,Γ(x)表示节点x指定方向上的的邻居,Γ(y)表示节点y指定方向上的的邻居;
Oxy=|Γ(x)∩Γ(y)|
Oxy表示节点x指定方向上的的邻居与节点y指定方向上的邻居节点重叠数量。
4.根据权利要求1所述一种融合多模体信息的有向网络链路预测方法,其特征在于,角色函数Rw值的计算方法为:
Vw表示节点对(x,y)的所有共同邻居节点,公式中NΔw是节点vw的邻居中相互连接的节点对的数目,NΛw是节点vw的邻居中相互不连接的节点对的数目。
5.根据权利要求1所述一种融合多模体信息的有向网络链路预测方法,其特征在于,单个模体节点对的r'xy列表值的计算方法为:
公式中其中MF=|V|(|V|-1)/2表示网络中所有可能存在的连边的数目,M=|ET|表示网络中真实存在的连边的数目,V为节点总数,E为网络中所有连边的集合。
6.根据权利要求5所述一种融合多模体信息的有向网络链路预测方法,其特征在于,双模体节点对的rxy列表值的计算方法为:
其中,|O1xy|表示节点x1指定方向上的的邻居与节点y1指定方向上的邻居节点重叠数量,|O2xy|表示节点x2指定方向上的的邻居与节点y2指定方向上的邻居节点重叠数量,Rv表示其中一个模体的角色函数值,Rw表示另一个模体的角色函数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910764256.2/1.html,转载请声明来源钻瓜专利网。