[发明专利]一种基于PU学习和随机游走的链接预测方法及装置有效
申请号: | 202010087931.5 | 申请日: | 2020-02-12 |
公开(公告)号: | CN111310822B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 梁吉业;李琦;王智强 | 申请(专利权)人: | 山西大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 郑晋周 |
地址: | 030000*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 pu 学习 随机 游走 链接 预测 方法 装置 | ||
本发明涉及一种基于PU学习和随机游走的链接预测方法及装置,其中,包括以下步骤:收集网络中节点的邻接关系;以节点对作为样本,根据邻接关系构造正例和无标记样本集;利用社区结构和集成学习,从无标记样本集中得到可靠负例样本集;根据可靠负例样本集与正例样本集进行有监督分类,得到链接预测分类器;根据链接预测分类器的预测结果构造节点间转移概率矩阵;根据节点间转移概率矩阵进行随机游走,最终确定节点间的游走概率;根据游走概率计算节点对的相似性,按相似性从大到小对节点对排序,从而预测链接的存在。本发明通过利用整个网络中节点间的游走信息,并在游走过程中结合网络社区结构,进一步提升了基于PU学习的链接预测方法的精度。
技术领域
本发明涉及网络数据挖掘领域,特别是涉及一种基于PU学习和随机游走的链接预测方法及装置。
背景技术
链接预测是网络数据挖掘领域的重要挖掘任务之一,其目的在于从给定的网络中挖掘节点之间未知的链接。链接预测对于信息补全、网络演化等具有重要研究意义,同时在生物信息、社交网络等领域发挥着重要应用价值。
在传统基于分类的链接预测方法中,链接预测通常被看作二分类问题。其中,将网络中存在链接的节点对视为正例,不存在链接的节点对则视为负例,进而基于正负例样本来构建链接预测分类器。然而,在给定的一个网络中,直接将未观察到链接的节点对视作负例是不准确的。为此,研究者进一步将链接预测看作是典型的(Positive and Unlabeled,PU)PU学习问题,即只有正例样本和无标记样本的学习问题。
已有基于PU学习的链接预测方法通常采用两步走策略:第一步从无标记样本中选择可靠负例样本集;第二步基于正例和可靠负例构建链接预测分类器。事实上,无论是传统基于分类的链接预测方法还是基于PU学习的链接预测方法,其所构建的分类器都是建立在样本满足独立同分布的假设基础之上,而在网络数据中,节点对是不满足独立同分布假设的。因此,单纯基于PU学习来进行链接预测是不准确的,难以保证链接预测的精度。
发明内容
本发明旨在一定程度上解决相关技术中的不足。
为此,本发明的一个目的在于提出一种基于PU学习和随机游走的链接预测方法,该方法可以提升基于PU学习的链接预测方法的精度。
本发明的另一目的在于提供一种基于PU学习和随机游走的链接预测装置。
为达到所述目的,本发明一方面提供了一种基于PU学习和随机游走的链接预测方法,包括:
获取网络中节点间的邻接关系;
根据网络中节点间的邻接关系,将节点对作为样本,构造正例样本集和无标记样本集;
利用社区结构和集成学习,从无标记样本集中得到可靠负例样本集;
根据可靠负例样本集与正例样本集进行有监督分类,得到链接预测分类器;
根据链接预测分类器的预测结果构造节点间转移概率矩阵;
根据节点间转移概率矩阵进行随机游走,最终确定节点间的游走概率;
根据游走概率计算节点对的相似性,按相似性从大到小对节点对排序,从而预测链接的存在。
优选地,所述根据链接预测分类器的预测结果构造节点间转移概率矩阵,包括:
根据链接预测分类器的预测结果构造矩阵W,其对角元素为0,其余元素为:
其中,f(vi,vj)表示预测分类器对样本(vi,vj)的预测结果,表示(vi,vj)已存在链接,表示(vi,vj)观察不到链接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087931.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:触控面板、其制备方法及触控显示装置
- 下一篇:一种图像扫描检测碳纤维板方法