[发明专利]异构信息网络链接预测方法、可读存储介质和终端在审
申请号: | 201811358463.X | 申请日: | 2018-11-14 |
公开(公告)号: | CN109543114A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 陈可佳;张培 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 网络链接 异构信息 多标记 可读存储介质 异构网络 测试集 分类器 训练集 样本集 终端 路径类型 路径提取 拓扑特征 样本向量 构建 异构 样本 标签 分类 学习 | ||
1.一种异构信息网络链接预测方法,其特征在于,包括:
设定待预测异构网络中节点对之间的元路径、元路径的最大长度和每种元路径类型设置对应的类型标签;
基于元路径提取节点对之间的异构拓扑特征,构建样本向量,组成样本集;所述样本集包括训练集和测试集;
基于所述样本集中的训练集和测试集进行多标记分类学习,得到对应的多标记分类器;
采用训练得到的多标记分类器对待预测异构网络中节点之间的未知关系进行预测。
2.根据权利要求1所述的异构信息网络链接预测方法,其特征在于,所述基于所述样本集中的训练集和测试集进行多标记分类学习,得到对应的多标记分类器,包括:
分别从所述训练集中选取与所设置的类型标签中每两个类型标签构成的标签对对应的训练子集,并对所选取的训练子集分别进行二分类学习,得到与每个标签对一一对应的多个二分类器;
将所述测试集分别输入训练得到的多个二分类器,计算所述测试集中的样本对应的实例在各个类型标签上获取的第一投票;
将对应的虚拟标签分别添加进对应的训练子集中的每个样本,得到对应的类型标签和虚拟标签构成的标签对对应的训练子集,并采用所得到的训练子集分别训练得到与每个类型标签一一对应的多个辅助二分类器;所述虚拟标签用于标记与对应的训练子集中的样本相关和不相关的类型标签的分割点;
将所述测试集分别输入训练得到的多个辅助二分类器,计算所述测试集中的样本对应的实例分别在每个类型标签上获得的第二投票和在虚拟标签上获取的第三投票;
基于所述测试样本对应的实例在所述每个类型标签上获得的第一投票和第二投票及在虚拟标签上获取的第三投票,确定最终的多标记分类器。
3.根据权利要求2所述的异构信息网络链接预测方法,其特征在于,所述节点对之间的异构拓扑特征,包括路径数特征和随机游走特征。
4.根据权利要求3所述的异构信息网络链接预测方法,其特征在于,所述测试集中的样本对应的实例在每个类型标签上获得的第一投票采用如下的公式计算得到:
其中,ζ(xi,lj)表示实例xi在标签lj上获得的投票,Clfjk表示标签对(lj,lk)对应的二分类器,表示在训练子集中正确地将样本预测为负例,当表示在训练子集中正确地将样本预测为正例。
5.根据权利要求4所述的异构信息网络链接预测方法,其特征在于,采用如下的公式计算所述测试集中的样本对应的实例在每个类型标签上获得的第二投票:
其中,ζ(xi,lj)表示实例xi在标签lj上获得的尚未更新的投票,Clfjk表示标签对(lj,lk)对应的二分类器,表示在训练子集中正确地将样本预测为正例。
6.根据权利要求5所述的异构信息网络链接预测方法,其特征在于,采用如下的公式计算所述测试集中的样本对应的实例在每个类型标签上获得的第二投票:
其中,ζ*(xi,ls)表示实例xi在虚拟标签ls上获得的投票,表示在训练子集中正确地将样本预测为负例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811358463.X/1.html,转载请声明来源钻瓜专利网。