[发明专利]一种基于知识图谱邻域结构的图谱完备化方法有效
申请号: | 201910271576.4 | 申请日: | 2019-04-04 |
公开(公告)号: | CN109992670B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 杜友田;李雪莲;曹富媛;王雪 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 针对知识图谱存在的三元组缺失问题,本发明提出一种基于邻域结构的知识图谱完备化技术。该技术基于知识图谱的实体邻域、关系邻域、实体与关系之间的对应关系等信息,对知识图谱的关系要素和实体要素进行建模。主要步骤为:①基于图谱中实体的邻域结构,建立模型将实体要素映射到实体向量空间内;②基于图谱中关系要素的邻域结构,建立模型将关系映射到关系向量空间内;③采用关系映射矩阵将实体表示映射到对应的关系空间内,建立三元组关联模型。为了更有效地训练模型,本发明提出基于邻域结构的负样本采样算法,对实体和关系进行联合训练,基于训练结果对未知三元组进行预测。本发明的贡献在于提出一种基于邻域结构的知识图谱完备化的有效技术。 | ||
搜索关键词: | 一种 基于 知识 图谱 邻域 结构 完备化 方法 | ||
【主权项】:
1.一种基于知识图谱邻域结构的图谱完备化方法,其特征在于,包括:1)知识图谱中的实体要素嵌入模型Entity2vec构建:依次将知识图谱中的每个实体v视为源实体,采用随机游走的方式对实体v周围的相邻实体进行选择,游走步数设定为固定值η,游走结束时原知识图谱即被转换为规模为|E|×η的实体序列矩阵,其中每一行表示实体v及其通过随机游走得到的相邻实体结点的序列,|E|为知识图谱中所有实体的数目,在该实体序列矩阵上选取实体v的邻域Ne(v),然后基于实体v与其邻域Ne(v)建立概率模型将实体v映射到对应的实体向量空间内,使得在知识图谱中相邻的实体在其实体向量空间内也处于相邻的位置,将Entity2vec模型训练得到头实体h的向量表示hent和尾实体t的向量表示tent;2)知识图谱中的关系要素嵌入模型Relation2vec构建:依次将知识图谱中的每个关系r视为源关系,采用随机游走的方式对关系r周围的相邻关系进行选择,游走步数设定为固定值β,游走结束时原知识图谱即被转换为规模为|R|×β的关系序列矩阵,其中每一行表示关系r及其通过随机游走得到的相邻关系结点的序列,|R|为知识图谱中所有关系的数目,在该关系序列矩阵上选取关系r的邻域Ne(r),然后基于关系r与其邻域Ne(r)建立概率模型将关系r映射到对应的关系向量空间内,使得在知识图谱中相邻的关系在其关系向量空间内也处于相邻的位置,将Relation2vec模型训练得到关系r的向量表示rrel;3)关系与实体之间的线性映射:为每个关系r定义映射矩阵Mr,将实体表示向量映射到对应的关系向量空间内得到联合向量空间,在该联合向量空间建立评价函数对三元组联合模型进行训练;4)在训练过程中,使用基于邻域的负样本采样算法,实现联合向量空间中相邻的三元组在训练过程中采集到的负实体结点同样处于相邻的位置;5)基于知识图谱完备化的链式预测:根据已知三元组的头结点与关系对尾结点进行预测,或是根据已知三元组的尾结点与关系对头结点进行预测,最终得到知识图谱完备化结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910271576.4/,转载请声明来源钻瓜专利网。