[发明专利]一种基于注意力机制的知识图谱路径可达性预测方法在审
申请号: | 202110244072.0 | 申请日: | 2021-03-05 |
公开(公告)号: | CN113051353A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 陆佳炜;朱昊天;王小定;郑嘉弘;张元鸣;徐俊;肖刚 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 知识 图谱 路径 可达性 预测 方法 | ||
1.一种基于注意力机制的知识图谱路径可达性分析方法,其特征在于,所述方法包括以下步骤:
第一步、从知识库中构建目标三元组,并获得该三元组中头实体h和尾实体t之间所有的路径关系;
第二步、进行关系编码,结合Word2vec将目标三元组中的直接关系和所有路径关系表示成向量,并将路径关系表示成的向量输入LSTM进行顺序编码,过程如下:
2.1、将头实体h和尾实体t之间的关系路径上的关系使用Word2vec转化为向量;初始化一个HashMap,用于存放头实体h和尾实体t之间的关系表示成的向量集合;
2.2、将HashMap中的向量顺序输入LSTM,用LSTM的最后一个状态作为关系路径的向量表示,用vπ(p)表示;
2.3、将头实体h和尾实体t之间的直接关系r使用Word2vec转化为向量,并将该向量记为再将输入LSTM,用LSTM的最后一个状态作为直接关系r的向量表示,用vπ(r)表示;
第三步、进行实体类型编码,结合Word2vec将目标三元组中的所有实体类型表示成向量,并将实体类型表示成的向量输入LSTM进行顺序编码;过程如下:
3.1、初始化一个HashMap,命名为entitymap,用于存放第二步中选择的关系路径上的头实体h和尾实体t之间的实体的类型层次集合;
3.2、获取选定关系路径上的头实体h和尾实体t之间的所有实体(包括头实体h和尾实体t)的实体类型;
3.3、用Word2vec把实体的实体类型转化为向量,并计算实体的类型上下文向量,将实体的类型上下文向量按顺序输入LSTM,并用LSTM的最后一个隐藏状态作为这条路径的实体类型编码的向量表示,用vε(p)表示;
第四步、重复第二步和第三步计算所有路径模式组合成的全局路径模式计算头实体h、直接关系r和尾实体t组成的三元组的能量函数,计算直接关系r能否连接头实体和尾实体的概率,将能量函数和能否链接的概率相乘,以此判断这个三元组是否成立;过程如下:
4.1、将每一条关系路径上的vπ(p)和vε(p)连接在一起,组成路径模式vρ(p)即vρ(p)=[vπ(p);vε(p)],最终获得所有路径模式的集合S={vρ(p1),vρ(p2),……,vρ(pN)};
4.2、使用软注意力机制将所有路径模式组合成全局路径模式
4.3、计算计算头实体h、直接关系r和尾实体t组成的三元组的能量函数,其中,h用头实体的类型上下文向量表示,t用尾实体t的类型上下文向量表示,r用2.3的结果vπ(r)表示,计算公式如下:
4.4、计算头实体和尾实体可以通过直接关系r连接的概率P(r|h,t),计算公式如下,其中σ就是sigmoid函数,fpred是一个前馈网络,就是4.2的全局路径模式:
4.5、计算头实体、尾实体和所有关系路径组成的整个三元组的能量函数,计算公式如下,其中exp(x)=ex,E(h,r,t)是4.3的能量函数,P(r|h,t)是4.4的结果,由于能量函数越接近于0越好,而概率越接近于1越好,因此将能量函数的结果的负数输入exp函数来保持整个能量函数的单调性:
G(h,r,t)=exp(-E(h,r,t))*P(r|h,t)
4.6、判断G(h,r,t)的值是否接近于1,若值越接近于1,说明这个直接关系r可以连接头实体h和尾实体t,这个三元组就成立;否则,不成立。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110244072.0/1.html,转载请声明来源钻瓜专利网。