[发明专利]一种能够编码关系语义多样性结构的知识图谱分布式表示方法有效
申请号: | 201810764406.5 | 申请日: | 2018-07-12 |
公开(公告)号: | CN109063021B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 陈华钧;张文;张宇轩 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 能够 编码 关系 语义 多样性 结构 知识 图谱 分布式 表示 方法 | ||
1.一种能够编码关系语义多样性结构的知识图谱分布式表示方法,包括如下步骤:
(1)获取知识图谱中所有的三元组,计算每个三元组的置信度;对于知识图谱中的任一三元组(h,r,t),通过以下公式计算出该三元组(h,r,t)的置信度s(h,r,t):
s(h,r,t)=σ(t·c(h,r))
其中:h、r、t分别表示三元组中的头实体、关系、尾实体,h为头实体向量,r为关系向量,t为尾实体向量,c(h,r)为头实体h与关系r的联合算子,为头实体在关系r下的线性变换矩阵,为关系r的线性变换矩阵,和均为d×d大小的对角矩阵且与关系r对应,bc为全局偏差向量,d为自定义的矩阵维度,tanh(z)为双曲正切函数,σ(z)为sigmoid非线性激活函数,z为函数自变量;
(2)以知识图谱中已有的三元组作为正样本,并为每个正样本构建对应的负样本并计算每个负样本的置信度;
(3)利用正样本和负样本对以下损失函数L进行最小化求解,从而得到知识图谱中所有实体和关系的向量以及所有关系的线性变换张量;
其中:Φ为所有正样本组成的集合,Ω为所有负样本组成的集合,P为所有训练参数组成的集合,x为集合Φ中的正样本,y为集合Ω中的负样本,p为集合P中的训练参数,λ为正则系数,sx为正样本x的置信度,sy为负样本y的置信度。
2.根据权利要求1所述的知识图谱分布式表示方法,其特征在于:所述步骤(2)中对于知识图谱中的任一正样本,利用知识图谱中已有的任一实体替换该正样本三元组中的头实体或尾实体,即得到其对应的负样本。
3.根据权利要求1所述的知识图谱分布式表示方法,其特征在于:所述步骤(3)中利用正样本和负样本通过随机梯度下降算法对损失函数L进行最小化求解。
4.根据权利要求1所述的知识图谱分布式表示方法,其特征在于:能够表达三种与关系语义相关的图结构:度结构、性质结构、关联结构;其中,度结构包括一对一,一对多,多对一和多对多四种关系结构类型;性质结构包括三种同关系环结构:分别为可代表自反性的一度同关系环结构、可代表对称性的二度同关系环结构以及可代表传递性的三度同关系环结构;关联结构主要包括同实体对多关系结构,即同一对实体之间存在多种关系,通常同实体对多关系结构与关系之间的相似性和等价性相关。
5.根据权利要求1所述的知识图谱分布式表示方法,其特征在于:所述双曲正切函数tanh(z)和sigmoid非线性激活函数σ(z)的表达式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810764406.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动态显示信息和操作的方法
- 下一篇:一种服务器系统信息的提取方法