[发明专利]一种知识图嵌入复合邻居链路预测方法在审
申请号: | 202110341110.4 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113077526A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 李灯熬;赵菊敏;柴晓玄 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06N3/04;G06N3/08 |
代理公司: | 北京一品慧诚知识产权代理有限公司 11762 | 代理人: | 张宇 |
地址: | 030600 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 嵌入 复合 邻居 预测 方法 | ||
1.一种知识图嵌入复合邻居链路预测方法,其特征在于,包括
复合邻居,从知识图谱实体描述中提取具有代表性的实体邻居;
动态记忆网络编码器,包含输入、问题、情景记忆以及回答模块,计算输入和问题的向量表示,触发Attention机制,选择出跟问题相关的输入;情景记忆模块结合相关的输入和问题进行迭代生成记忆,并且生成一个答案的向量表示;以及
KGE解码器和培训目标,使用不同的KGE模型来进行链路预测。
2.根据权利要求1所述的知识图嵌入复合邻居链路预测方法,其特征在于,所述实体e生成复合邻居的过程包括:
从知识图谱中提取两组邻居,在知识图谱三元组的邻居集中,本地邻居包括至少有一个知识图谱中包含e的三元组的实体;在实体描述的邻居集合中,通过完全匹配它们的名称来提取e的文本描述中提到的实体;此语义邻居被定义为名称出现在e的描述中的实体,以及描述中提及的e名称的实体;即为语义上的邻居;
从两个集合中最多抽取K个实体来组成e的复合邻居,选择同时出现在两个集合中的邻居;使用随机抽样的方法填充其余的复合邻居。
3.根据权利要求1所述的知识图嵌入复合邻居链路预测方法,其特征在于,所述输入模块使用GRU对输入进行编码;对于单个句子时使用GRU中间的state作为输入;对于多个句子时使用GRU在每个句子的最后状态作为输入。
4.根据权利要求1所述的知识图嵌入复合邻居链路预测方法,其特征在于,所述问题模块使用GRU将问题编码成向量;
所述问题向量作为记忆模块GRU的初始隐层状态。
5.根据权利要求1所述的知识图嵌入复合邻居链路预测方法,其特征在于,所述情景记忆模块包括注意力机制、记忆更新、多次迭代;
所述注意力机制使用一个门控函数作为Attention;
输入是本时刻的输入c,前一时刻的记忆m和问题q;首先计算相互之间的相似度作为特征向量传入一个两层的神经网络,最终计算出来的值就是门控函数的值,即该输入与问题之间的相似度;
得分函数G将特征集z(c,m,q)作为输入,并生成标量分数;首先定义一个特征向量来获取输入,记忆和问题向量之间的相似性:
G(c,m,q)=σ(W(2)tanh(W(1)z(c,m,q)+b(1))+b(2));
所述记忆更新计算出门控函数的值之后,根据其大小对记忆进行更新;更新方法就是GRU算出的记忆乘以门控值,再加上原始记忆乘以1-门控值;
更新情景记忆mi=GRU(e2,mi-1),GRU的初始状态变为被初始化的。
所述多次迭代包括每次迭代关注不同的内容,这样传递推导,检索不同的信息。
6.根据权利要求1所述的知识图嵌入复合邻居链路预测方法,其特征在于,所述回答模块使用GRU最为本模块的模型,根据记忆模块最后的输出向量,输入使用的是问题和上一时刻的输出值连接起来,并使用交叉熵损失函数作为loss进行反向传播训练;
使用另一个GRU,初始状态被初始化为最后一个记忆
在每一个时间点,将问题q,最后的隐藏状态at-1,以及先前预测的输出yt-1作为输入;
yt=softmax(W(a)at)
at=GRU([yt-1,q],at-1)。
7.根据权利要求1所述的知识图嵌入复合邻居链路预测方法,其特征在于,“使用不同的KGE模型来进行链路预测”包括:
采用三种KGE模型作为KGE解码器,包括TransE、ConvE和RotatE;对于TransE解码器,使用随机梯度下降来最小化链路损耗,并应用Adam优化器来最小化ConvE和RotatE的损耗函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110341110.4/1.html,转载请声明来源钻瓜专利网。