[发明专利]一种可解释的可生成规则的知识图谱嵌入表示学习方法在审
申请号: | 202011551586.2 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112612903A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 陈华钧;张文;陈名杨;邓淑敏 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06N5/02;G06N5/04;G06N20/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 彭剑 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可解释 生成 规则 知识 图谱 嵌入 表示 学习方法 | ||
1.一种可解释的可生成规则的知识图谱嵌入表示学习方法,其特征在于,包括:
(1)获取知识图谱中所有三元组的实体和关系,构建表示学习模型,为每个实体和关系分别学习一个嵌入表示;
(2)对于目标三元组,首先对头实体的邻居节点进行基于注意力机制的聚合,得到经过聚合的头实体表示;
(3)然后通过聚合的头实体表示、关系嵌入表示、尾实体嵌入表示计算目标三元组的得分;
(4)根据目标三元组的得分,利用损失函数计算知识图谱中所有三元组合在一起的损失函数值,利用基于梯度的优化方法对表示学习模型进行多轮优化直至模型收敛;
(5)模型训练完毕后,为输入的头实体和关系进行链接预测,根据预测结果以及模型的中间结果生成解释,得到每个三元组的多条解释;
(6)对所有三元组生成的解释进行规则化,得到一系列规则,并统计其出现的次数,保留出现次数较高的规则作为最后输出的规则。
2.根据权利要求1所述的可解释的可生成规则的知识图谱嵌入表示学习方法,其特征在于,步骤(2)中,经过聚合的头实体表示通过以下步骤获得:
(2-1)获取目标三元组以头实体为核心的k阶邻接子图以及邻接子图中所有三元组的连接情况;
(2-2)根据实体和关系的嵌入表示,获取邻接子图中所有三元组的共享头实体嵌入表示;
(2-3)根据实体和关系的嵌入表示,获取邻接子图中所有三元组的共享尾实体嵌入表示;
(2-4)根据邻接子图的共享头实体表示和共享尾实体嵌入表示获取相似度矩阵;
(2-5)根据相似度矩阵和邻接子图的连接矩阵获取过滤不连接三元组后的相似度矩阵;
(2-6)根据过滤后的相似度矩阵对目标三元组进行聚合,得到目标三元组的头实体表示。
3.根据权利要求2所述的可解释的可生成规则的知识图谱嵌入表示学习方法,其特征在于,步骤(2-1)中,目标三元组(h,r,t)和k阶邻接子图表示为有序集合N,其中,Ni=(hi,ri,ti)表示第i个邻接的三元组,N中的最后一个三元组为目标三元组,即N|N|=(h|N|,r|N|,t|N|)=(h,r,t)。
4.根据权利要求2所述的可解释的可生成规则的知识图谱嵌入表示学习方法,其特征在于,步骤(2-2)中,获取邻接子图中所有三元组的共享头实体嵌入表示时,根据尾实体和关系得到共享头实体的嵌入表示,公式为:
Sh=T-R
其中,分别是表示当前邻接子图中所有三元组的尾实体嵌入表示以及关系嵌入表示;
步骤(2-3)中,获取邻接子图中所有三元组的共享尾实体嵌入表示时,根据头实体和关系得到共享尾实体的嵌入表示:
St=H+R
其中,分别是表示当前邻接子图中所有三元组的头实体嵌入表示以及关系嵌入表示。
5.根据权利要求2所述的可解释的可生成规则的知识图谱嵌入表示学习方法,其特征在于,步骤(2-4)中,相似度矩阵的公式为:
C=Sh(St)T
其中,是一个表示不同三元组之间相似度的矩阵,Sh为共享头实体的嵌入表示,St为共享尾实体的嵌入表示。
6.根据权利要求5所述的可解释的可生成规则的知识图谱嵌入表示学习方法,其特征在于,步骤(2-5)的具体过程为:
将C与输入邻接子图的邻接矩阵A按位相乘,对非邻接的三元组相似度进行去除:
其中,C′表示过滤不连接三元组后的相似度矩阵,A表示N中三元组邻接性的矩阵,如果在当前子图中Nj是Ni的一阶邻居三元组,那么Aij=1,否则Aij=0,运算符表示矩阵按位相乘。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011551586.2/1.html,转载请声明来源钻瓜专利网。