[发明专利]知识图谱的构建方法及系统、信息查询方法及系统在审
申请号: | 202110159980.X | 申请日: | 2021-02-05 |
公开(公告)号: | CN112765288A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 杨丛聿;仇应俊 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/245;G06F40/295 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 田金霞 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 系统 信息 查询 | ||
本发明公开一种知识图谱的构建方法及系统、信息查询方法及系统,其中构建方法包括构建抽象概念图的方法,具体包括以下步骤:获取若干个标签,并获取各标签之间的关联关系;将所述标签作为结点,将所述关联关系作为边,构建有向图作为抽象概念图。本发明通过对抽象概念图的设计,不仅能够避免基础知识图谱中产生超大结点,还能通过抽象概念图中标签的关系弥补基础知识图谱中结点间中断的关系,便于后续基于标签间的关系对实体间潜在关系的分析和挖掘。
技术领域
本发明涉及信息处理领域,尤其涉及一种知识图谱的构建方法及系统、信息查询方法及系统。
背景技术
知识图谱中信息的存储形式主要包括属性、边、标签等,其中属性和边作为图的基本要素,标签则属于特殊属性,通常以多值的形式进行存储,主要用于对实体进行抽象描述,便于后续进行分类查询。
目前知识图谱普遍采用图数据库进行数据存储,大多数图数据库中头、尾结点都会存储边的信息,当知识图谱中存在入边/出边过多的结点时,后续对该知识图谱的维护和查询较为困难。
将入边/出边数量超过预设数量阈值(如10000)的结点的记为超大结点,如将人和地域作为实体,籍贯作为一种关系,省/市可能成为超大结点;将人和朝代作为实体,所处时代作为关系,朝代或历史时期可能成为超大结点;针对上述情况,为避免出现超大结点,本领域技术人员往往会采用属性进行存储此方法将放弃关系分析的潜在价值,导致后续无法进一步挖掘实体间潜在的关系。
发明内容
本发明针对现有技术中为避免产生超大结点,将关系由属性代替时导致关系数据丢失的缺点,提供了一种知识图谱的构建技术,以及基于该知识图谱进行的信息查询技术,利用标签间的关联关系延续实体间的关系。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种知识图谱的构建方法,所述知识图谱包括基础知识图谱(即基于现有技术所构建的知识图谱)和抽象概念图,构建所述抽象概念图的方法包括以下步骤:
获取若干个标签,并获取各标签之间的关联关系;
将所述标签作为结点,将所述关联关系作为边,构建有向图作为抽象概念图。
作为一种可实施方式:
所述标签包括基类标签和概念标签,其中基类标签用于标识实体类型,概念标签用于标识实体属性。
作为一种可实施方式:
所述抽象概念图为有向无环图。
基础知识图谱的结构不限。
本发明还提出一种知识图谱的构建系统,包括获取单元和构建单元;
所述获取单元,用于获取若干个标签,还用于获取各标签之间的关联关系;
所述构建单元,用于将所述标签作为结点,将所述关联关系作为边,构建有向图作为抽象概念图。
本发明还提出一种信息查询方法,包括以下步骤:
获取标签查询请求;
基于所述标签查询请求于上述任意一项构建方法所构建的抽象概念图进行路径查询,获得相应的标签关联路径。
作为一种可实施方式:
所述标签查询请求包括目标标签和标签查询条件,其中目标标签的数量为1或2,标签查询条件包括跳数阈值,所述跳数阈值用于限定所述标签关联路径的长度。
作为一种可实施方式,当所述目标标签的数量为1时,获得相应的标签关联路径的方法为:
将所述目标标签所对应的结点作为原点,从抽象概念图中提取跳数在所述跳数阈值以内的结点,获得关联结点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110159980.X/2.html,转载请声明来源钻瓜专利网。