[发明专利]一种基于注意力机制的知识图谱嵌入方法在审
申请号: | 201810235088.3 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108763237A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 钱炜;蔡登;付聪;祝宇;何晓飞 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 马士林 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注意力机制 嵌入 图谱数据 图谱 注意力集中 反应类别 复杂关系 关系判断 初始化 多对多 多对一 算法 维度 向量 更新 | ||
1.一种基于注意力机制的知识图谱嵌入方法,其特征在于,包括以下步骤:
(1)输入需要补全的知识图谱数据集,基于注意力机制对知识图谱数据集进行初始化;
(2)基于注意力机制对嵌入表示进行更新,得到嵌入表示结果和注意力机制参数;
(3)根据嵌入表示结果和注意力机制参数,补全知识图谱数据集。
2.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(1)中,所述初始化的具体步骤为:
(1-1)随机初始化数据集中所有的关系与实体对应的向量,得到初始的关系向量与实体向量;
(1-2)对于每个关系向量r,将出现在训练条目头部的实体加入到头实体集合SHr,将出现在训练条目尾部的实体加入到尾实体集合STr;
(1-3)将每个关系向量r的头实体集合SHr与尾实体集合STr分别加入到候选头实体集合Hr与候选尾实体集合Tr,将候选头实体集合Hr和候选尾实体集合Tr初始化为整个实体集合E;
(1-4)将每个关系r的注意力向量ar初始化为每一维都是1的向量。
3.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(2)中,所述基于注意力机制对嵌入表示进行更新的具体步骤为:
(2-1)从数据集的训练集中采样固定大小的一批数据Δbatch;
(2-2)对Δbatch中的每一个三元组(h,r,t)随机生成一个错误的三元组(h',r,t'),用三元组对{(h,r,t),(h′,r,t′)}构成当前迭代所用的训练数据Tbatch;
(2-3)计算整个算法的损失函数,并采用随机梯度下降算法更新嵌入表示;
(2-4)当迭代次数达到预定值M,则更新注意力机制相关的参变量Hr,Tr,ar;
(2-5)重复步骤2-1~步骤2-4,直至整个算法收敛。
4.根据权利要求3所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(2-3)中,所述损失函数的公式为:
其中,h,r,t,h′,t′为三元组对{(h,r,t),(h',r,t′)}的嵌入表示,fr(h,t)=||ar*h+r-ar*t||,fr(h,t)为评估函数,ar为关系注意力向量,Hr为候选头实体集合,Tr为候选尾实体集合,α为两部分损失的权重系数,γ为正负样例之间的最小间隔,[x]+表示取正,当x<0时结果为0。
5.根据权利要求3所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(2-4)中,所述更新注意力机制相关的参变量的算法包括:
(2-4-1)利用Kmeans算法将所有实体向量聚成c类,C1,…,Cc;
(2-4-2)根据以下两个表达式分别得到Hr和Tr;
其中,Cj为聚类得到的第j个类别的实体集合,SHr为头实体集合,STr为尾实体集合;
(2-4-3)对于每一个关系向量r,计算Hr与Tr中所有实体向量的方差与若或者的第j维大于临界值δ,则ar,j=1;否则,ar,j=0。
6.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(3)中,所述补全知识图谱数据集的具体步骤为:
(3-1)对于一个关系三元组(h,r,t),首先检查h是否属于Hr,t是否属于Tr,不属于的话,那么h或t的类别就不适合作为关系r的头实体或尾实体,这个三元组不成立,如果属于的话,则执行下一步;
(3-2)将h和t的表示向量分别乘以注意力向量ar;
(3-3)计算评估函数fr(h,t)=||arh+r-art||,如果分值低于阈值则认为该三元组成立,并且分数越低该关系成立的可能性越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810235088.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种简化复杂计算的方法
- 下一篇:一种数据展示方法、装置及设备