[发明专利]一种基于属性聚合的知识图谱嵌入方法及其存储介质有效
申请号: | 201910220268.9 | 申请日: | 2019-03-22 |
公开(公告)号: | CN109933674B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 温秀秀;高原原;马超;康子路;谢海永;王亚珅;刘弋锋 | 申请(专利权)人: | 中国电子科技集团公司信息科学研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 属性 聚合 知识 图谱 嵌入 方法 及其 存储 介质 | ||
一种基于属性聚合的知识图谱嵌入方法及其存储介质,该方法包括将知识图谱中的属性聚合并转化为实体;利用知识图谱中已经存在的三元组构成所有正例,形成正例训练数据集合O+,构造值域类反例和关系类反例,形成反例训练数据集合O‑,建立知识图谱嵌入目标函数,并利用上一步骤形成的训练数据求解目标函数。本发明通过属性聚合,将属性转化为实体,再进行知识图谱嵌入,防止了知识图谱嵌入结果中属性信息的丢失;采用基于关系值域的值域类反例构建方法,以及基于类型关系域的关系类反例构建方法,降低假反例出现的可能性,提高训练样本的质量,从而间接提升知识图谱嵌入结果与知识图谱真实结构的一致性。
技术领域
本发明涉及知识图谱领域,具体的,涉及一种知识图谱中的属性聚合,将知识图谱中属性转化为实体,增加知识图谱中的实体嵌入和关系嵌入所能包含的信息量的知识图谱嵌入方法及其存储介质。
背景技术
知识图谱具有描述现实世界复杂关系的能力,其概念自2012年提出以来,就受到学术界和各个应用领域的广泛关注。如今,已经存在了大量的知识图谱系统,这些系统在信息提取、专家系统、知识问答、以及社会网络分析等领域都发挥了重要作用。
知识图谱是一个描述实体、以及实体之间关系的图结构。知识图谱由三个基本元素组成:实体、关系、属性。实体是指现实存在的物体(例如“姚明”),以及抽象概念(例如“植物”);关系是指实体之间联系,例如“叶莉”是“姚明”的妻子;属性是指实体的特征,例如“226厘米”是“姚明”的身高属性。知识图谱中的实体具有全局标识符;实体的属性通常为字符串。
现有的知识图谱大多采用图形式进行表示,然而实际应用中,图形式难以直接输入到神经网络等人工智能模型中,限制了知识图谱的实际应用,据此知识图谱嵌入应运而生。知识图谱嵌入是指将知识图谱中的实体和关系转化为连续向量空间中的向量,使得知识图谱在保存结构的同时,扩展知识图谱的使用范围。知识图谱嵌入在知识图谱补全、知识推理等方面具有重要的应用意义。
现有技术一“一种融合多背景知识的知识图谱嵌入方法与流程”公开了一种知识图谱嵌入方法,主要包括以下步骤:1)从知识库的实体标签中选择优质的实体描述信息,从Web语料中选择与实体相关的优质语料,构成多背景知识;2)通过嵌入多背景知识来学习知识库的嵌入表示;3)使用长短记忆模型从多背景知识获得相应实体的语义嵌入向量;4)将融合嵌入机制用于多背景知识与实体关系细粒度结合,完成融合多背景知识的知识图谱嵌入。
但该现有技术一具有如下缺点:
(1)该方法以Web语料为基础,需要在网络上采集信息。网络信息具有来源复杂,可信度差的特点。以Web语料为基础会增加知识图谱嵌入工作量,还为知识图谱嵌入过程引入不确定性,难以保障知识图谱嵌入结果的可信度。
(2)在进行知识图谱嵌入时,并没有考虑实体的属性,丢失了大量的信息,因此形成的嵌入结果难以应用在实体属性发现领域,具有局限性。
现有技术二“一种基于知识图谱的词嵌入深度学习方法”公布了一种知识图谱嵌入方法。方法主要包含步骤:(1)依据语义强度对知识图谱中的实体关系进行划分;(2)基于划分后的各实体关系组来产生不同路径长度的训练样本;(3)词嵌入深度学习阶段,构造深度神经网络结构;(4)以步骤2中的训练样本集为输入来迭代优化深度神经网络结构的参数。训练完成后,保留网络结构中的编码器和卷积神经网络两个部件构成词嵌套编码器。
但该现有技术二具有如下缺点:
(1)在训练样本中的反例生成中采用完全随机的替换方法,其结果可能产生假反例(例如“姚明的国籍是中国”是一个随机产生的假反例),从而影响最终的嵌入结果。
(2)在进行知识图谱嵌入时,该方法同样并没有考虑实体的属性,丢失了大量的信息,因此形成的嵌入结果难以应用在实体属性发现领域,具有局限性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司信息科学研究院,未经中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910220268.9/2.html,转载请声明来源钻瓜专利网。