[发明专利]一种图数据库构建方法、计算设备及可读存储介质在审
申请号: | 202010669156.4 | 申请日: | 2020-07-13 |
公开(公告)号: | CN111930958A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 南怡;李娟娟;石智中 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/901 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 构建 方法 计算 设备 可读 存储 介质 | ||
1.一种图数据库构建方法,适于在计算设备中执行,所述方法包括:
根据所构建图数据库的知识领域,确定该知识领域涉及的实体以及实体属性;
根据所述实体和实体属性初始化实体信息表,所述实体信息表包括节点表、关系表和操作记录表,其中,节点表适于存储节点信息,关系表适于存储节点之间的关系,操作记录表适于存储对节点表和关系表的操作记录;
从数据源中获取源数据,对所述源数据进行预处理后存入所述实体信息表;
根据所述实体和实体属性创建图数据库的结构;
从实体信息表获取实体信息,将所述实体信息导入图数据库,完成图数据库的构建。
2.如权利要求1所述的方法,其中,所述数据源包括信息文件、网页拉取和消息推送,所述对所述源数据进行预处理后存入所述实体信息表包括:
从不同数据源中获取同一个实体的实体属性进行整合后存入所述实体信息表。
3.如权利要求1或2所述的方法,其中,所述根据所述实体和实体属性初始化实体信息表包括:
创建所述节点表的表结构,所述节点表包含的字段有实体类型、实体属性和实体唯一标识。
4.如权利要求1-3中任意一项所述的方法,其中,所述根据所述实体和实体属性初始化实体信息表还包括:
创建所述关系表的的表结构,所述关系表包含的字段有关系类型、关系开始实体索引编号号、关系结束实体索引编号和关系属性,所述实体索引编号为该实体在节点表中的索引编号。
5.如权利要求1-4中任意一项所述的方法,其中,所述根据所述实体和实体属性初始化实体信息表还包括:
创建所述操作记录表的表结构,所述操作记录表包含的字段有表类型、更新记录索引编号、更新类型和更新前的数据信息。
6.如权利要求5所述的方法,其中,所述表类型包括节点表和关系表;所述更新类型包括插入、更新和删除。
7.如权利要求1-6中任意一项所述的方法,其中,所述从实体信息表获取实体信息,将所述实体信息导入图数据库包括:
从实体信息表中获取实体信息,包括实体和实体属性信息;
将获取到的实体信息进行精简,删除图数据库不需要的属性信息,获得精简实体信息;
将所述精简实体信息进行规范化处理,获得规范实体信息;
将所述规范实体信息存储到图数据库中,同时生成图数据库导入日志。
8.一种图数据库构建装置,包括:
实体生成模块,适于根据所构建图数据库的知识领域,确定该知识领域涉及的实体以及实体属性;
实体信息表构建模块,适于根据所述实体和实体属性初始化实体信息表,包括节点表、关系表、操作记录表,其中,节点表适于存储节点信息,关系表适于存储节点之间的关系,操作记录表适于存储对节点表和关系表的操作记录;
源数据处理模块,适于从数据源中获取源数据,对所述源数据进行预处理后存入所述实体信息表;
图数据库构建模块,适于根据所述实体和实体属性创建图数据库的结构,还适于从实体信息表中获取实体信息,将所述实体信息导入图数据库,完成图数据库的构建。
9.一种终端设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-7所述的方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由终端设备执行时,使得所述终端设备执行根据权利要求1-7所述的方法中的任一方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010669156.4/1.html,转载请声明来源钻瓜专利网。