[发明专利]基于路径和图上下文的知识图谱补全方法在审
申请号: | 202211169234.X | 申请日: | 2022-09-26 |
公开(公告)号: | CN115795042A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 陆佳炜;朱昊天;李家朋;王琪冰;肖刚;李琛;徐俊;程振波;吴俚达;王志鹏 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/048;G06N3/044;G06N3/045;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 路径 上下文 知识 图谱 方法 | ||
1.一种基于路径和图上下文的知识图谱补全方法,其特征在于,所述方法包括以下步骤:
第一步:构建链接预测模型,补全任务是预测一个不完整的知识图谱中缺失的链接关系;
第二步、在链接预测模型中的嵌入层进行路径嵌入表示;
第三步、在链接预测模型中的图上下文组合层进行图上下文组合,知识图谱视为一个有向图,对于有向图来说,这种图上下文结构分为两类:一种是进入目标实体的邻居实体和关系构成的图上文结构,另一种是从目标实体离开的邻居实体和关系构成的图下文结构;这两种上下文结构映射到知识图谱,定义为实体-关系上文对和关系-实体下文对,分别体现了目标实体的上文信息和下文信息,给定一个知识图谱G=(E,R,T),E,R,T分别表示实体集、关系集和正例三元组集;
第四步、在链接预测模型中的Bi-LSTM层中构建双向LSTM网络;
第五步、在链接预测模型中的注意力层进行路径模式整合,路径包含了实体和关系的全部信息,但是不是所有路径都可以用来表示实体之间需要预测的关系r,因此,引入了注意力机制来衡量路径对路径组合的重要性,通过加权求和的方式来整合路径模式;
第六步、在链接预测模型的输出层进行输出,由于全路径模式表示代表了所有包含关系和实体类型信息的路径,且具有正确的抽象级别,因此可以通过计算头实体eh和尾实体et能被关系r链接的概率P(r|eh,et);
其中,概率P(r|eh,et)由一个线性函数fp和sigmoid激活函数来计算:
第七步、目标函数的定义,目标是最小化链接概率的负对数值(L),对于每一个需要预测的关系rj,都将训练集中的三元组分为两个部分,正例三元组集T和负例三元组集F,集合中每一个三元组都含有关系rj,记训练集中三元组的个数为N,目标函数如下:
这个目标函数的训练目标是训练模型在正确的三元组上得出更高的值,在缺失的不正确的三元组上得出更低的值,同时最小化总体误差。
2.如权利要求1所述的基于路径和图上下文的知识图谱补全方法,其特征在于,所述第一步中,链接预测模型分为以下五层:
(1)嵌入层:进行路径嵌入,选择三元组构成的路径集合P中的一条路径,将路径上的实体和关系输入嵌入层;
(2)图上下文组合层:按照路径中实体和关系的顺序,将实体和关系的向量嵌入组合成实体-关系上文对和关系-实体下文对;
(3)Bi-LSTM层:将组合层的结果按序输入Bi-LSTM网络,同时保存每一个LSTM单元的当前隐藏状态;
(4)注意力层:将前向LSTM输出和后向LSTM输出组合成一个向量矩阵;
(5)输出层:将全路径模式输入一个线性前馈网络,获得eh和et能被关系r链接的概率P(r|eh,et),其中P(r|eh,et)表示事件eh和et的联合分布条件下事件r的条件概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211169234.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种镀锌池的浮渣清理装置
- 下一篇:一种电极箔生产用精轧机