[发明专利]一种基于注意力机制的知识图谱嵌入方法在审

专利信息
申请号: 201810235088.3 申请日: 2018-03-21
公开(公告)号: CN108763237A 公开(公告)日: 2018-11-06
发明(设计)人: 钱炜;蔡登;付聪;祝宇;何晓飞 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 马士林
地址: 310013 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 注意力机制 嵌入 图谱数据 图谱 注意力集中 反应类别 复杂关系 关系判断 初始化 多对多 多对一 算法 维度 向量 更新
【权利要求书】:

1.一种基于注意力机制的知识图谱嵌入方法,其特征在于,包括以下步骤:

(1)输入需要补全的知识图谱数据集,基于注意力机制对知识图谱数据集进行初始化;

(2)基于注意力机制对嵌入表示进行更新,得到嵌入表示结果和注意力机制参数;

(3)根据嵌入表示结果和注意力机制参数,补全知识图谱数据集。

2.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(1)中,所述初始化的具体步骤为:

(1-1)随机初始化数据集中所有的关系与实体对应的向量,得到初始的关系向量与实体向量;

(1-2)对于每个关系向量r,将出现在训练条目头部的实体加入到头实体集合SHr,将出现在训练条目尾部的实体加入到尾实体集合STr

(1-3)将每个关系向量r的头实体集合SHr与尾实体集合STr分别加入到候选头实体集合Hr与候选尾实体集合Tr,将候选头实体集合Hr和候选尾实体集合Tr初始化为整个实体集合E;

(1-4)将每个关系r的注意力向量ar初始化为每一维都是1的向量。

3.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(2)中,所述基于注意力机制对嵌入表示进行更新的具体步骤为:

(2-1)从数据集的训练集中采样固定大小的一批数据Δbatch

(2-2)对Δbatch中的每一个三元组(h,r,t)随机生成一个错误的三元组(h',r,t'),用三元组对{(h,r,t),(h′,r,t′)}构成当前迭代所用的训练数据Tbatch

(2-3)计算整个算法的损失函数,并采用随机梯度下降算法更新嵌入表示;

(2-4)当迭代次数达到预定值M,则更新注意力机制相关的参变量Hr,Tr,ar

(2-5)重复步骤2-1~步骤2-4,直至整个算法收敛。

4.根据权利要求3所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(2-3)中,所述损失函数的公式为:

其中,h,r,t,h′,t′为三元组对{(h,r,t),(h',r,t′)}的嵌入表示,fr(h,t)=||ar*h+r-ar*t||,fr(h,t)为评估函数,ar为关系注意力向量,Hr为候选头实体集合,Tr为候选尾实体集合,α为两部分损失的权重系数,γ为正负样例之间的最小间隔,[x]+表示取正,当x<0时结果为0。

5.根据权利要求3所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(2-4)中,所述更新注意力机制相关的参变量的算法包括:

(2-4-1)利用Kmeans算法将所有实体向量聚成c类,C1,…,Cc

(2-4-2)根据以下两个表达式分别得到Hr和Tr

其中,Cj为聚类得到的第j个类别的实体集合,SHr为头实体集合,STr为尾实体集合;

(2-4-3)对于每一个关系向量r,计算Hr与Tr中所有实体向量的方差与若或者的第j维大于临界值δ,则ar,j=1;否则,ar,j=0。

6.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(3)中,所述补全知识图谱数据集的具体步骤为:

(3-1)对于一个关系三元组(h,r,t),首先检查h是否属于Hr,t是否属于Tr,不属于的话,那么h或t的类别就不适合作为关系r的头实体或尾实体,这个三元组不成立,如果属于的话,则执行下一步;

(3-2)将h和t的表示向量分别乘以注意力向量ar

(3-3)计算评估函数fr(h,t)=||arh+r-art||,如果分值低于阈值则认为该三元组成立,并且分数越低该关系成立的可能性越大。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810235088.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top