[发明专利]一种基于实体距离的知识表示学习方法有效
申请号: | 201911004013.5 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110909172B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 张毅;曹万华;王振杰;饶子昀;刘俊涛;王军伟;高子文 | 申请(专利权)人: | 中国船舶重工集团公司第七0九研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/02 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
地址: | 430000 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 实体 距离 知识 表示 学习方法 | ||
1.一种基于实体距离的知识表示学习方法,其特征在于,包括以下步骤:
(1)对知识图谱的训练样本中的关系和实体进行向量表示;
(2)对于训练样本中的每个关系,根据实体是否在该关系组成的三元组中出现,将所有实体划分为两个集合;其中,实体集合划分方法为:对于每个关系r,r∈R,将实体集合E划分为Er′与Er″,其中,实体集合Er′中的实体在知识图谱中由关系r组成的三元组中出现过,即Er′={e|e∈E,h,t∈E,(h,r,e)∈S或(e,r,t)∈S};而Er″为Er′的补集合,即Er″=E-Er′;其中h为头实体,t为尾实体;
(3)根据预设概率在(2)中划分的两个集合中选取实体进行实体替换生成负例;其中,替换实体生产负例的方法具体为:给定Er′与Er″的集合分配概率ω,其中ω为实数且ω∈[0,1],取随机值pr∈[0,1],当pr∈[0,ω]时,Er′集合中取实体构造负例;否则,在Er″集合中取实体构造负例;
(4)定义训练的目标函数;
(5)将实体关系三元组代入模型进行训练,求解实体和关系的表示向量,从而在向量空间中通过距离计算实现语义推理。
2.根据权利要求1所述的基于实体距离的知识表示学习方法,其特征在于,所述步骤(1)中,对知识图谱的训练样本数据中的关系和实体进行向量表示,即实体集合E={e1,e2,…,en},其中每个实体ei都是一个m维的向量;同样有关系集合R={r1,r2,…,rn},其中每个关系ri也是一个m维的向量,n表示训练样本数据个数。
3.根据权利要求2所述的基于实体距离的知识表示学习方法,其特征在于,对知识图谱中的所有实体集合E={e1,e2,…,en},中的每个实体ei进行随机初始化为m维的向量,并限制模长为1;同样对所有的关系集合R={r1,r2,…,rn},中的每个关系ri也进行随机初始化为m维的向量,并限制模长为1,其中m为大于0的自然数。
4.根据权利要求1至3任一项所述的基于实体距离的知识表示学习方法,其特征在于,在步骤(3)中替换实体生产负例的方法为:
对于训练样本数据中正确的三元组(h,r,t),头实体h或尾实体t被一个随机实体替换为新的头实体h′或尾实体t′,其中h′和t′也属于实体集合E中。
5.根据权利要求4所述的基于实体距离的知识表示学习方法,其特征在于,所述步骤(4)中,定义训练的目标函数:
式中,运算符号[x]+=max(0,x),运算符号表示向量x的L2距离平方,S(h,r,t)表示知识图谱中存在的三元组集合,S′(h,r,t)表示通过选取Er′中的实体替换生成的负例三元组集合,S″(h,r,t)表示通过选取Er″中的实体替换生成的负例三元组集合;fr(h,t)表示正例三元组的评分函数值,fr(h′,t′)和fr(h,t)分别表示抽取集合Er′和Er″中实体构造负例三元组的评分函数;α,β分别表示从S′与S″集合中选取三元组构造负例时,评分函数所占的权重;γ是一个常量用于间隔正例和负例,尾项用于防止训练过程中出线过拟合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七0九研究所,未经中国船舶重工集团公司第七0九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911004013.5/1.html,转载请声明来源钻瓜专利网。