[发明专利]图神经网络的训练与知识图谱的补全方法、装置在审
申请号: | 202110790683.5 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113641829A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 黄焱晖;卞东海;蔡远俊;彭卫华;徐伟建 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 知识 图谱 方法 装置 | ||
1.一种图神经网络的训练方法,包括:
获取知识图谱,根据所述知识图谱得到多个训练样本与多个训练样本的标注结果,每个训练样本为由所述知识图谱中的头结点、关系与尾结点构成的三元组;
得到所述多个训练样本中头结点的头结点向量、关系的关系向量与尾结点的尾结点向量;
构建包含语义层、卷积层与输出层的初始图神经网络,所述卷积层用于根据所述语义层输出的头结点语义向量与关系语义向量得到卷积向量;
使用多个训练样本的头结点向量、关系向量、尾结点向量与多个训练样本的标注结果对所述初始图神经网络进行训练,得到目标图神经网络。
2.根据权利要求1所述的方法,其中,所述根据所述知识图谱得到多个训练样本与多个训练样本的标注结果包括:
将从所述知识图谱中提取的三元组作为正例训练样本,将所述正例训练样本的标注结果设置为1;
将所述正例训练样本中的头结点、关系与尾结点中的至少一个进行替换,将替换结果作为负例训练样本,将所述负例训练样本的标注结果设置为0。
3.根据权利要求1所述的方法,其中,所述卷积层根据所述语义层输出的头结点语义向量与关系语义向量得到卷积向量包括:
将头结点语义向量与关系语义向量进行拼接;
对拼接结果进行卷积计算,得到所述卷积向量。
4.根据权利要求1所述的方法,其中,所述使用多个训练样本的头结点向量、关系向量、尾结点向量与多个训练样本的标注结果对所述初始图神经网络进行训练,得到目标图神经网络包括:
针对每个训练样本,将该训练样本的头结点向量、关系向量与尾结点向量作为所述语义层的输入,得到由所述语义层输出的头结点语义向量、关系语义向量与尾结点语义向量;
将所述头结点语义向量与所述关系语义向量作为所述卷积层的输入,得到由所述卷积层输出的卷积向量;
将所述卷积向量与所述尾结点语义向量作为所述输出层的输入,得到由所述输出层输出的相似度结果;
使用该训练样本的标注结果与相似度结果计算损失函数值,根据所述损失函数值调整所述初始图神经网络的参数,直至所述初始图神经网络收敛,得到所述目标图神经网络。
5.一种知识图谱的补全方法,包括:
获取待补全知识图谱;
生成头结点向量、关系向量与尾结点向量;
将所述头结点向量、关系向量与尾结点向量输入目标图神经网络,得到所述目标图神经网络输出的相似度结果;
在确定所述相似度结果满足预设要求的情况下,根据所述头结点向量、关系向量、尾结点向量与所述待补全知识图谱,完成所述待补全知识图谱的补全;
其中,所述目标图神经网络是根据权利要求1-4中任一项方法预先训练得到的。
6.根据权利要求5所述的方法,其中,所述生成头结点向量、关系向量与尾结点向量包括:
随机生成维度相同的三个向量;
将随机生成的三个向量分别作为所述头结点向量、关系向量与尾结点向量。
7.根据权利要求5所述的方法,其中,所述根据所述头结点向量、关系向量、尾结点向量与所述待补全知识图谱,完成所述待补全知识图谱的补全包括:
确定所述待补全知识图谱中对应所述头结点向量的目标头结点、对应所述关系向量的目标关系与对应所述尾结点向量的目标尾结点;
将所述目标头结点、目标关系与目标尾结点构成三元组,添加到所述待补全知识图谱中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110790683.5/1.html,转载请声明来源钻瓜专利网。