[发明专利]知识图谱的处理方法、装置及电子设备有效

专利信息
申请号: 201710392166.6 申请日: 2017-05-27
公开(公告)号: CN108959328B 公开(公告)日: 2021-12-21
发明(设计)人: 丁磊;童毅轩;董滨;姜珊珊;张永伟 申请(专利权)人: 株式会社理光
主分类号: G06F16/36 分类号: G06F16/36;G06F16/35
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 黄灿;张博
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 知识 图谱 处理 方法 装置 电子设备
【说明书】:

发明提供了一种知识图谱的处理方法、装置及电子设备,处理方法包括:从待处理的知识图谱中获取实体集,实体集包括具有关系信息的第一实体和第二实体,从数据库中获取文本信息和图像信息;根据知识图谱的结构信息生成第一实体的第一结构信息向量和第二实体的第二结构信息向量,分别生成第一实体的第一文本信息向量、第一实体的第一图像信息向量、第二实体的第二文本信息向量以及第二实体的第二图像信息向量;建立联合损失函数,在联合损失函数最优化时得到第一实体的第一目标向量、第二实体的第二目标向量和第一实体与第二实体之间关系信息的目标关系向量。本发明能够提供更加准确和全面的知识图谱中实体和关系的向量化表示。

技术领域

本发明涉及自然语言处理以及知识图谱的技术领域,特别是指一种知识图谱的处理方法、装置及电子设备。

背景技术

随着社会飞速发展,我们已经进入信息爆炸时代,每天都会有海量新的实体与信息产生。互联网作为当今最为便捷的信息获取平台,用户对有效信息筛选与归纳的需求日益迫切,如何从海量数据中获取有价值的信息成为一个难题,知识图谱于此应运而生。

知识图谱将世界上所有人物、地名、书名、球队名等专有名词与事物表示为实体,将实体之间的内在联系表示为关系,旨在将数据库中的海量知识表示为实体之间利用关系作为桥梁的三元关系组。例如,北京是中国的首都这一知识,在知识图谱中则利用三元组关系(北京,是……首都,中国)进行表示。

知识图谱也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

具体来说,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法和计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。其把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来。

随着知识图谱研究的发展,知识图谱能够很好的辅助自然语言处理及语义分析。但随着知识的积累,知识图谱的数据量增大,结构越来越复杂。而近年来在知识图谱的研究上取得了显著的进展,将知识图谱中所有实体与关系映射到一个低维连续向量空间中,能够解决之前知识图谱学习时产生的稀疏性与效率问题。

但是目前,知识图谱中实体和关系的向量化表示存在的问题是:已有的算法都是从知识图谱的拓扑结构中计算实体和关系的向量化表示,缺乏对实体其他信息的使用,不够准确和全面。

发明内容

本发明要解决的技术问题是提供一种知识图谱的处理方法、装置及电子设备,能够提供更加准确和全面的知识图谱中实体和关系的向量化表示。

为解决上述技术问题,本发明的实施例提供技术方案如下:

一方面,提供一种知识图谱的处理方法,包括:

从待处理的知识图谱中获取实体集,所述实体集包括有第一实体和第二实体,所述第一实体和所述第二实体之间具有关系信息;

从数据库中获取与所述第一实体和所述第二实体相关的文本信息和图像信息;

根据所述知识图谱的结构信息生成所述第一实体的第一结构信息向量和所述第二实体的第二结构信息向量,根据所获取的文本信息和图像信息分别生成所述第一实体的第一文本信息向量、所述第一实体的第一图像信息向量、所述第二实体的第二文本信息向量以及所述第二实体的第二图像信息向量;

根据所述第一结构信息向量、第一文本信息向量、第一图像信息向量、第二结构信息向量、第二文本信息向量、第二图像信息向量建立联合损失函数,并对所述联合损失函数进行优化,在所述联合损失函数最优化时得到所述第一实体的第一目标向量、所述第二实体的第二目标向量和第一实体与第二实体之间关系信息的目标关系向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710392166.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top