[发明专利]一种基于知识图谱的关系抽取方法和系统有效

专利信息
申请号: 201711398108.0 申请日: 2017-12-21
公开(公告)号: CN108073711B 公开(公告)日: 2022-01-11
发明(设计)人: 雷凯;沈颖;温德斯 申请(专利权)人: 北京大学深圳研究生院
主分类号: G06F16/36 分类号: G06F16/36;G06F40/295;G06K9/62;G06N3/04;G06N3/08
代理公司: 深圳鼎合诚知识产权代理有限公司 44281 代理人: 任葵
地址: 518055 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 关系 抽取 方法 系统
【说明书】:

本申请公开了一种基于知识图谱的关系抽取方法和系统,其中方法包括:从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;根据所述最短路径集合提取实体对的路径结构信息;根据所述实体的描述属性提取实体对的属性文本信息;根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。在本申请的具体实施方式中,由于包括从知识图谱中提取实体的描述属性与连接实体对的路径,构建一个基于知识图谱路径结构信息与实体属性信息的关系抽取模型,通过提取知识图谱的路径信息与属性信息,从中挖掘其潜在语义信息,免去收集语料集与标注训练集,从而降低构建数据集的代价,提升关系抽取效率。

技术领域

本申请涉及数据挖掘技术领域,尤其涉及一种基于知识图谱的关系抽取方法和系统。

背景技术

随着认知神经、深度学习等领域的持续发展,人工智能逐渐涉足各个领域,致力于改善人们的生活,在图像识别、语音识别等领域已经超越了人类的水平。然而在自然语言处理领域,由于人类语言的复杂性以及事物的多样性,目前的技术尚不能达到完全理解语义的程度,因此需要一个语义联通的桥梁——知识图谱。知识图谱由知识以及知识之间的关系组成,其本质上来讲是一种语义网络,网络中的节点表示现实世界存在的实体(Entity),节点之间的边表示两个实体之间的关系。通过点与边的组合,将现实世界的知识抽象成可供机器处理应用的知识网络。目前知识图谱技术主要用于智能语义搜索、移动个人助理以及问答系统中。

许多研究机构与公司正在构建自己的知识图谱,如谷歌的Knowledge Graph,百度的知心等。目前已有许多开源的大型知识图谱项目,如freebase,YAGO,DBpedia等,但这些知识图谱还远未达到完备的阶段,而知识图谱的知识覆盖度直接决定了语义理解结果,并影响后续应用的效果。因此知识图谱补全是一个非常重要的问题,其关键是如何自动抽取信息得到候选知识单元,其中涉及的技术包括:实体抽取、关系抽取和属性抽取。其中关系抽取是提取实体对之间关联关系。目前主流的关系抽取方法是有监督的学习方法、半监督的学习方法和无监督的学习方法三种。与半监督的学习方法和无监督的学习方法相比,有监督的学习方法准确率与召回率更高,因此受到越来越多的关注。然而有监督的学习方法需要大量的人工标注训练语料,随着大数据时代的来临,实体对数量达到数十亿的量级,传统方法已无法满足需求。因此,在关系抽取问题中,如何降低构造数据集难度,提升模型训练效率成为了一个越来越重要的问题。

发明内容

本申请提供一种基于知识图谱的关系抽取方法和系统。

根据本申请的第一方面,本申请提供一种基于知识图谱的关系抽取方法,包括:

从知识图谱中提取实体的描述属性与连接实体对的最短路径集合;

根据所述最短路径集合提取实体对的路径结构信息;

根据所述实体的描述属性提取实体对的属性文本信息;

根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系。

上述方法,提取连接实体对的最短路径集合,具体包括:

将知识图谱视作有向图,利用双向广度优先搜索算法与深度优先搜索算法相结合,提取两个实体间的连通最短路径集合。

上述方法,所述根据所述最短路径集合提取实体对的路径结构信息,具体包括:

利用路径编码模型将最短路径转换成低维度路径向量表示,再将所有最短路径的向量表示融合,构建两个实体间的路径结构信息。

上述方法,所述根据所述实体的描述属性提取实体对的属性文本信息,具体包括:

使用GRU模型将文本结构的属性信息转换成低维度向量表示,再计算实体对属性信息之间的差值,构建两个实体的属性文本信息。

上述方法,所述根据实体对的路径结构信息与属性文本信息抽取实体对之间的关系,具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711398108.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top