[发明专利]知识图谱的构建方法及系统、查询方法及系统在审
申请号: | 202010837217.3 | 申请日: | 2020-08-19 |
公开(公告)号: | CN112015908A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 杨丛聿;仇应俊;郝凯 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 田金霞 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 系统 查询 | ||
本发明公开一种知识图谱的构建方法及系统、查询方法及系统,其中构建方法包括派生标签录入步骤,具体步骤为:基于所述关系信息构建继承树,所述继承树每一个节点为一个实体类,所述节点间的关系为相应实体类之间的继承关系;当录入所述实体时,基于所述继承树提取与所述实体相对应的所有实体类,生成派生标签并录入;其中查询方法的具体步骤为:获取查询请求数据,基于所述查询请求数据于上述所构建的知识图谱中进行查询,生成查询结果并输出。本发明通过派生标签指示相关实体所涉及的继承关系,打通继承树上任一层级的查询,适用于多层继承场景,尤其适用于数据量大、涉及广泛、继承树深的新闻行业。
技术领域
本发明涉及信息处理领域,尤其涉及一种知识图谱的构建方法及系统、还涉及该知识图谱对应的查询方法及系统。
背景技术
知识图谱是结构化的语义知识库,可用于描述物理世界中的概念及其关系,填补了机器对于人类世界认知的不足,构建知识图谱分为自底向上构建方式和自顶向下构建方式,自底向上构建方式为数据驱动,针对没有完整知识体系的数据;自顶向下构建方式为专家驱动,需要预先定义好本体模型。
对于业务本体结构明确的场景在构建知识图谱时通常选用自顶向下的构建方式。使用该方式时需要预先构建本体模型,但现有基于本体模型在处理类型间的继承时相对乏力。
发明内容
本发明针对现有技术中的缺点,提供了适用于多层继承场景的一种知识图谱的构建方法及系统,以及基于所构建的知识图谱进行的查询方法及系统。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种知识图谱的构建方法,包括以下步骤:基于本体模型对所收集的行业数据进行数据抽取,获得实体数据,其中本体模型包括实体类以及各实体类之间的关系信息,实体数据包括若干个实体;录入所述实体数据,生成相应的知识图谱;
还包括派生标签录入步骤,具体步骤为:
基于所述关系信息构建继承树,所述继承树每一个节点为一个实体类,所述节点间的关系为相应实体类之间的继承关系;
当录入所述实体时,基于所述继承树提取与所述实体相对应的所有实体类,生成派生标签并录入。
作为一种可实施方式:
当录入所述实体时,根据所述实体对应的节点,基于所述节点从相应继承树中提取根节点至所述节点的路径中所有实体类作为派生标签,还以所述根节点对应的实体类作为所述实体的类型。
作为一种可实施方式,还包括继承树的变更步骤,具体步骤为:
获取新增节点请求,其包括新增实体类和新增继承关系;
基于所述新增继承关系于相应继承树中插入所述新增实体类作为新增节点;
提取插入所述新增实体类的时间,获得并记录相对应的新增时间点。
作为一种可实施方式:
本体模型还包括各实体类的拓展属性组,当同一实体类对应多组拓展属性组时,各拓展属性组相互隔离;
所述拓展属性组用于隔离同一实体在不同领域或业务的属性信息。
作为一种可实施方式:
所述知识图谱为新闻知识图谱;
实体类包括基础实体和派生实体,其中基础实体作为相应继承树的根节点,派生实体作为子节点或叶子节点;
所述基础实体包括人物、机构、地理和事件,所述派生实体包括机构、地理和事件的细粒度实体;
所述人物具有若干拓展属性组,用于录入各人物在对应领域下的属性信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010837217.3/2.html,转载请声明来源钻瓜专利网。