[发明专利]一种可解释的可生成规则的知识图谱嵌入表示学习方法在审
申请号: | 202011551586.2 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112612903A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 陈华钧;张文;陈名杨;邓淑敏 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06N5/02;G06N5/04;G06N20/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 彭剑 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可解释 生成 规则 知识 图谱 嵌入 表示 学习方法 | ||
本发明公开了一种可解释的可生成规则的知识图谱嵌入表示学习方法,包括:进行融合了注意力机制的嵌入表示学习模型的学习;根据嵌入表示学习模型对知识图谱中的三元组进行解释的生成;根据生成的解释经过逆实例化过程得到潜在规则,并通过出现次数统计得到可以输出的规则。本发明特别适合需要较高预测准确度、为预测提供解释以及需要沉淀推理规则的拥有复合推理需求的应用场景。
技术领域
本发明属于知识图谱推理的技术领域,尤其是涉及一种可解释的可生成规则的知识图谱嵌入表示学习方法。
背景技术
传统的知识图谱嵌入表示学习方法通过输入的目标三元组中包含的头实体、关系以及尾实体进行三元组得分计算,计算过程一步到位,因此多数为黑盒模型,可解释性较差。如公开号为CN108197290A的中国专利文献公开了一种融合实体和关系描述的知识图谱表示学习方法。
传统的知识图谱规则挖掘模型多数基于图上的搜索和匹配进行规则挖掘,是一个非计算的过程,在大型知识图谱上会遇到搜索空间爆炸的问题。如公开号为CN106874378A的中国专利文献公开了一种基于规则模型的实体抽取与关系挖掘构建知识图谱的方法。
而且传统的黑盒知识图谱嵌入表示学习模型只能完成预测任务,不仅无法为预测提供解释,更加无法提供用于预测的规则,而传统的规则挖掘模型以产出符号化规则为目标,但限于规则集合的覆盖度,并不能为所有的三元组进行预测。
但知识图谱推理的实际应用往往是一个人机交互的过程,其不仅仅需要准确率较高的算法模型,更加需要算法模型为预测结果提供解释以便专家判断预测结果的合理性,同时也需要算法模型产生出可编辑的符号化规则以便融合专家的专业知识。为了避免多次开发的任务,真实的应用需要较高准确率的预测模型并希望模型能够提供解释和生成规则。
发明内容
本发明提供了一种可解释的可生成规则的知识图谱嵌入表示学习方法,特别适用于不仅需要较高准确率预测模型,而且还需要模型提供解释以及规则的应用场景。
一种可解释的可生成规则的知识图谱嵌入表示学习方法,包括:
(1)获取知识图谱中所有三元组的实体和关系,构建表示学习模型,为每个实体和关系分别学习一个嵌入表示;
(2)对于目标三元组,首先对头实体的邻居节点进行基于注意力机制的聚合,得到经过聚合的头实体表示;
(3)然后通过聚合的头实体表示、关系嵌入表示、尾实体嵌入表示计算目标三元组的得分;
(4)根据目标三元组的得分,利用损失函数计算知识图谱中所有三元组合在一起的损失函数值,利用基于梯度的优化方法对表示学习模型进行多轮优化直至模型收敛;
(5)模型训练完毕后,为输入的头实体和关系进行链接预测,根据预测结果以及模型的中间结果生成解释,得到每个三元组的多条解释;
(6)对所有三元组生成的解释进行规则化,得到一系列规则,并统计其出现的次数,保留出现次数较高的规则作为最后输出的规则。
步骤(1)中,针对知识图谱中每个的实体e,学习一个嵌入表示针对知识图谱中每个的关系r,学习一个嵌入表示
步骤(2)中,经过聚合的头实体表示通过以下步骤获得:
(2-1)获取目标三元组以头实体为核心的k阶邻接子图以及邻接子图中所有三元组的连接情况;
(2-2)根据实体和关系的嵌入表示,获取邻接子图中所有三元组的共享头实体嵌入表示;
(2-3)根据实体和关系的嵌入表示,获取邻接子图中所有三元组的共享尾实体嵌入表示;
(2-4)根据邻接子图的共享头实体表示和共享尾实体嵌入表示获取相似度矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011551586.2/2.html,转载请声明来源钻瓜专利网。