[发明专利]异构信息网络链接预测方法、可读存储介质和终端在审
申请号: | 201811358463.X | 申请日: | 2018-11-14 |
公开(公告)号: | CN109543114A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 陈可佳;张培 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 网络链接 异构信息 多标记 可读存储介质 异构网络 测试集 分类器 训练集 样本集 终端 路径类型 路径提取 拓扑特征 样本向量 构建 异构 样本 标签 分类 学习 | ||
一种异构信息网络链接预测方法、可读存储介质和终端,所述方法包括:设定待预测异构网络中节点对之间的元路径、元路径的最大长度和每种元路径类型设置对应的类型标签;基于元路径提取节点对之间的异构拓扑特征,构建样本向量,组成样本集;所述样本集包括训练集和测试集;基于所述样本集中的训练集和测试集进行多标记分类学习,得到对应的多标记分类器;采用训练得到的多标记分类器对待预测异构网络中节点之间的未知关系进行预测。上述的方案,可以提高异构信息网络链接预测的准确性。
技术领域
本发明属于数据分析技术领域,特别是涉及一种异构信息网络链接预测 方法、可读存储介质和终端。
背景技术
现实世界中的许多复杂系统可以被形式化为网络,节点表示对象,链接 表示对象之间的交互。其中的大多数网络为异构网路,其包含各种类型的对 象和关系,通常由多个子网络构成。例如,在线社交网络Twitter包含关于诸 如用户基本信息、用户位置和用户推特操作的类型的信息,具有发表/回复/ 转发推文、关注/跟随、签到等等的类型的信息。
作为链接挖掘中的关键问题,链接预测旨在基于当前或历史网络预测未 来链接的形成。它具有应用于书目网络、生物网络、社交网络等领域的更广 泛的应用。大多数现有的链接预测方法被设计用于同构信息网络,其节点和 链接是相同的类型。近来,在异构网络中推动链接预测有巨大的兴趣,因为 它具有更广泛的应用前景。
但是,现有技术中的异构网络中链接预测,存在预测准确性低的问题。
发明内容
本发明解决的技术问题是如何提高异构信息网络链接预测的准确性。
为了达到上述目的,本发明提供了一种异构信息网络链接预测方法,所 述方法包括:
设定待预测异构网络中节点对之间的元路径、元路径的最大长度和每种 元路径类型设置对应的类型标签;
基于元路径提取节点对之间的异构拓扑特征,构建样本向量,组成样本 集;所述样本集包括训练集和测试集;
基于所述样本集中的训练集和测试集进行多标记分类学习,得到对应的 多标记分类器;
采用训练得到的多标记分类器对待预测异构网络中节点之间的未知关系 进行预测。
可选地,所述基于所述样本集中的训练集和测试集进行多标记分类学习, 得到对应的多标记分类器,包括:
分别从所述训练集中选取与所设置的类型标签中每两个类型标签构成的 标签对对应的训练子集,并对所选取的训练子集分别进行二分类学习,得到 与每个标签对一一对应的多个二分类器;
将所述测试集分别输入训练得到的多个二分类器,计算所述测试集中的 样本对应的实例在各个类型标签上获取的第一投票;
将对应的虚拟标签分别添加进对应的训练子集中的每个样本,得到对应 的类型标签和虚拟标签构成的标签对对应的训练子集,并采用所得到的训练 子集分别训练得到与每个类型标签一一对应的多个辅助二分类器;所述虚拟 标签用于标记与对应的训练子集中的样本相关和不相关的类型标签的分割点;
将所述测试集分别输入训练得到的多个辅助二分类器,计算所述测试集 中的样本对应的实例分别在每个类型标签上获得的第二投票和在虚拟标签上 获取的第三投票;
基于所述测试样本对应的实例在所述每个类型标签上获得的第一投票和 第二投票及在虚拟标签上获取的第三投票,确定最终的多标记分类器。
可选地,所述节点对之间的异构拓扑特征,包括路径数特征和随机游走 特征。
可选地,所述测试集中的样本对应的实例在每个类型标签上获得的第一 投票采用如下的公式计算得到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811358463.X/2.html,转载请声明来源钻瓜专利网。