[发明专利]基于转移矩阵的链接预测方法、系统和可读存储介质在审
申请号: | 202310268892.2 | 申请日: | 2023-03-16 |
公开(公告)号: | CN116306926A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 张广志;成立立;于笑博 | 申请(专利权)人: | 北京融信数联科技有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N3/0499;G06F18/2415 |
代理公司: | 北京沃杰永益知识产权代理事务所(普通合伙) 11905 | 代理人: | 杨杰 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 转移 矩阵 链接 预测 方法 系统 可读 存储 介质 | ||
本发明公开的一种基于转移矩阵的链接预测方法、系统和可读存储介质,其中方法包括:基于预设的知识图谱进行子图采样得到子图样本;获取子图样本的随机游走画像以计算随机游走转移矩阵;将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新;基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征;基于所述目标特征结合更新后的随机游走画像获取目标链接以完成链接预测作业。本发明可以有效改善高频共现的节点之间目标链接被错误地预测为真的问题,同时转移矩阵和随机游走画像具有很强的可解释性。
技术领域
本发明涉及知识图谱以及自然语言处理技术领域,更具体的,涉及一种基于转移矩阵的链接预测方法、系统和可读存储介质。
背景技术
知识图谱是对现实世界的数据映射,例如蛋白质的互作用、社交网络等。由于被观察和收集到的数据始终只是现实世界的其中一部分,因此知识图谱的一个核心问题就是解决链接的缺失,也就是链接预测(Link Prediction)问题。
现有的实现方式往往基于启发式的算法:基于两个节点共同的临近节点信息来判断目标链接是否应该存在。启发式算法有一个很强的假设,路径上节点的权重和路径长度直接相关,距离目标链接越远的节点,对目标链接的影响越小。这种启发式算法不容易转化为知识图谱的节点特征和边特征。
因此图神经网络的编码方式开始成为主流,使用图神经网络做链接预测有两种策略,一种是用打分函数对目标链接的头尾实体进行评估,另一种是对目标链接所在的子图整体做子图分类。尽管如此,当前对于池化层的权重设置,以及转移矩阵的概率更新仍然有很大的提升空间。当前的池化层权重虽然由训练得来,但没有考虑在不同的拓扑层级下,应该有不同的权重变化;当前的转移矩阵由节点的度数和对目标链接的重要性权重相乘得来,是一个固定值,也不能体现在拓扑层次变化后,重要度产生的变化。
发明内容
本发明的目的是提供一种基于转移矩阵的链接预测方法、系统和可读存储介质,可以有效改善高频共现的节点之间目标链接被错误地预测为真的问题,同时转移矩阵和随机游走画像具有很强的可解释性。
本发明第一方面提供了一种基于转移矩阵的链接预测方法,包括以下步骤:
基于预设的知识图谱进行子图采样得到子图样本;
获取子图样本的随机游走画像以计算随机游走转移矩阵;
将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新;
基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征;
基于所述目标特征结合更新后的随机游走画像获取目标链接以完成链接预测作业。
本方案中,所述基于预设的知识图谱进行子图采样得到子图样本,具体包括:
获取所述知识图谱GO=(V,EO),其中,V是节点集合,EO是观测到的链接集合;
基于所述知识图谱进行k跳子图采样得到子图样本G(V,E),其中,E是子图链接集合。
本方案中,所述获取子图样本的随机游走画像以计算随机游走转移矩阵,具体包括:
基于节点集合V识别子图样本中的节点Z,将节点Z编码为边权重;
获取两个节点Z的关联编码ωx,y,其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京融信数联科技有限公司,未经北京融信数联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310268892.2/2.html,转载请声明来源钻瓜专利网。