[发明专利]知识图谱上的树状规则提取方法及装置在审
申请号: | 202310294052.3 | 申请日: | 2023-03-23 |
公开(公告)号: | CN116578714A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 刘康;何世柱;赵军;孙望涛 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06N5/02;G06N7/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 陈新生 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 树状 规则 提取 方法 装置 | ||
本发明提供一种知识图谱上的树状规则提取方法及装置,所述方法包括:从知识图谱上提取链式规则;对所述链式规则进行前向推理,得到对目标规则体变量的预测结果;基于所述预测结果进行反向推理,得到所述目标规则体变量表示;基于所述目标规则体变量表示将候选原子补充到目标规则体变量处,得到树状规则。本发明提供的知识图谱上的树状规则提取方法及装置,基于链式规则,补充候选原子,得到树状规则,提升了规则的表达能力,使得规则更加准确,具有更好的链接预测效果。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种知识图谱上的树状规则提取方法及装置。
背景技术
知识图谱上的规则挖掘可以用来描述数据的一般规律,有助于理解数据,并在此基础上进行推理、补全、和检错纠错。
相关技术中从知识图谱上提取的规则通常为链式规则,链式规则形如其中,r0(x0,x1)∧r1(x1,x2)∧…∧rn(xn,xn+1)为链式规则的规则体,规则体由多个原子(三元组rn(xn,xn+1),r表示关系,x表示变量实体)的合取组成,r(x0,xn+1)为链式规则的规则头,规则头是包含目标谓词的单个原子。链式规则能够通过结合神经网络嵌入和可微分归纳逻辑编程(Differentiable ILP)等方法缓解规则提取面临的组合爆炸问题,进而完成规则提取。
通过链式规则提取方法得到的链式规则,由于其链式结构限制了规则的表达能力,使得规则的准确性不高。
发明内容
本发明提供一种知识图谱上的树状规则提取方法及装置,用以解决现有技术中链式规则的准确性不高的技术问题。
第一方面,本发明提供一种知识图谱上的树状规则提取方法,包括:
从知识图谱上提取链式规则;
对所述链式规则进行前向推理,得到对目标规则体变量的预测结果;
基于所述预测结果进行反向推理,得到所述目标规则体变量表示;
基于所述目标规则体变量表示将候选原子补充到目标规则体变量处,得到树状规则。
在一些实施例中,对所述链式规则进行前向推理,得到对目标规则体变量的预测结果,包括:
对所述链式规则进行前向推理,得到所述链式规则的规则头和规则体;
利用规则头对目标规则体变量进行预测,得到预测结果中的第一预测向量,并利用规则体对目标规则体变量进行预测,得到预测结果中的第二预测向量。
在一些实施例中,基于所述预测结果进行反向推理,得到所述目标规则体变量表示,包括:
将所述第一预测向量与所述第二预测向量逐元素相乘,得到正例实体表示和负例实体表示;
基于所述正例实体表示和所述负例实体表示进行反向推理,得到目标规则体变量表示。
在一些实施例中,基于所述目标规则体变量表示将候选原子补充到目标规则体变量处,包括:
利用多种预设的候选原子表示分别与目标规则体变量表示做内积,筛选出目标规则体变量对应的最优的候选原子;
将最优的候选原子补充到目标规则体变量处。
在一些实施例中,利用多种预设的候选原子表示分别与目标规则体变量表示做内积,筛选出目标规则体变量对应的最优的候选原子,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310294052.3/2.html,转载请声明来源钻瓜专利网。