[发明专利]一种图数据库构建方法、计算设备及可读存储介质在审
申请号: | 202010669156.4 | 申请日: | 2020-07-13 |
公开(公告)号: | CN111930958A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 南怡;李娟娟;石智中 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/901 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 构建 方法 计算 设备 可读 存储 介质 | ||
本发明公开了一种图数据库构建方法,适于在计算设备中执行,其中,该方法包括:根据所构建图数据库的知识领域,确定该知识领域涉及的实体以及实体属性;根据实体和实体属性初始化实体信息表,包括节点表、关系表、操作记录表,其中,节点表适于存储节点信息,关系表适于存储节点之间的关系,操作记录表适于存储对节点表和关系表的操作记录;从数据源中获取源数据,对源数据进行预处理后存入实体信息表;根据实体和实体属性创建图数据库的结构;从实体信息表获取实体信息,将实体信息导入图数据库,完成图数据库的构建。本发明一并公开了相应的图数据库构建装置、计算设备和可读存储介质。
技术领域
本发明涉及数据处理领域,尤其涉及一种图数据库构建方法、计算设备及可读存储介质。
背景技术
知识图谱也称为科学知识图谱,描述了专业知识领域内实体和实体属性之间的关系,其本质是一个图数据库。目前关于图数据库的设计流程一般为:先抽象出实体、实体属性、实体间的关系,根据抽象出的实体和实体属性建立图数据库结构中的顶点和边,然后根据所建立的图数据库结构导入数据。然而在数据导入过程中,一旦导入失败,将无法完成数据的及时恢复和数据补偿。同时,由于所有数据只存在于图数据库中,所有数据的更新查询操作都是直接通过图数据库完成,影响效率。
随之,一种数据驱动的图数据库构建方法应运而上,该方法以图数据库为中心,外围通过关系型数据库及文档数据库进行数据存储,关系型数据库存储属性以及属性的层级关系,文档数据库存储文本数据,关系型数据库、文档数据库通过实体的唯一标识与图数据库关联,最后对两个数据库进行知识融合构建知识图谱。这一方法虽然在外围存储了图数据库的数据来源,但仍需要进行知识融合才能导入图数据库,当遇到数据误删,或者进行数据补偿时,不能直接利用外围数据存储,在数据变更或者查询时,也不能依赖外围数据存储来减少对图数据库的查询、更新的压力。
发明内容
为此,本发明提供了一种图数据库构建方法、计算设备和可读存储介质,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种图数据库构建方法,适于在计算设备中执行,其中,该方法包括:根据所构建图数据库的知识领域,确定该知识领域涉及的实体以及实体属性;根据实体和实体属性初始化实体信息表,包括节点表、关系表、操作记录表,其中,节点表适于存储节点信息,关系表适于存储节点之间的关系,操作记录表适于存储对节点表和关系表的操作记录;从数据源中获取源数据,对源数据进行预处理后存入实体信息表;根据实体和实体属性创建图数据库的结构;从实体信息表获取实体信息,将实体信息导入图数据库,完成图数据库的构建。
可选的,在根据本发明的图数据库构建方法中,数据源包括信息文件、网页拉取和消息推送,对源数据进行预处理后存入实体信息表包括:从不同数据源中获取同一个实体的实体属性进行整合后存入实体信息表。
可选的,在根据本发明的图数据库构建方法中,根据实体和实体属性初始化实体信息表包括:创建节点表的表结构,节点表包含的字段有实体类型、实体属性和实体唯一标识。
可选的,在根据本发明的图数据库构建方法中,根据实体和实体属性初始化实体信息表还包括:创建关系表的的表结构,关系表包含的字段有关系类型、关系开始实体索引编号、关系结束实体索引编号和关系属性,所述实体索引编号为该实体在节点表中的索引编号。
可选的,在根据本发明的图数据库构建方法中,根据实体和实体属性初始化实体信息表还包括:创建操作记录表的表结构,操作记录表包含的字段有表类型、更新记录索引编号、更新类型和更新前的数据信息。
可选的,在根据本发明的图数据库构建方法中,表类型包括节点表和关系表;更新类型包括插入、更新和删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010669156.4/2.html,转载请声明来源钻瓜专利网。