[发明专利]一种批量数据导入图像数据库的方法和装置在审
申请号: | 201910606480.9 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110427505A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 袁博 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/25 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 胡艳华;解婷婷 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图形数据库 批量数据 预设格式 方法和装置 图像数据库 格式文件 内存计算 读取 工作效率 技术基础 节点数据 节点文件 预设程序 大数据 构建 创建 图谱 | ||
1.一种批量数据导入图像数据库的方法,其特征在于,所述方法包括:
将要导入到图形数据库的批量数据变换为预设格式的文件;所述批量数据包括节点数据和边数据;所述预设格式的文件包括:parquet格式文件;所述parquet格式文件包括:parquet节点文件和parquet边文件;
通过创建的内存计算框架读取所述预设格式的文件;
使用预设程序创建所述内存计算框架和所述图形数据库的连接,并根据所述图形数据库的类型,通过所述连接将所述预设格式的文件导入所述图形数据库。
2.根据权利要求1所述的批量数据导入图像数据库的方法,其特征在于,
所述parquet节点文件的信息包括:需要导入到所述图形数据库的节点类型的第一标签label信息;
所述parquet边文件的信息包括:需要导入到所述图形数据库的边类型的第二label信息。
3.根据权利要求2所述的批量数据导入图像数据库的方法,其特征在于,
所述parquet节点文件的信息还包括:需要导入到所述图形数据库的节点类型的身份标识ID信息和/或节点属性信息;
所述parquet边文件的信息还包括:需要导入到所述图形数据库的边类型的边属性信息。
4.根据权利要求1所述的批量数据导入图像数据库的方法,其特征在于,所述方法还包括:通过Java语言编写计算引擎spark程序,以创建所述内存计算框架。
5.根据权利要求1所述的批量数据导入图像数据库的方法,其特征在于,所述使用预设程序创建所述内存计算框架和所述图形数据库的连接包括:
使用所述预设程序创建连接所述图形数据库的驱动driver连接。
6.根据权利要求1所述的批量数据导入图像数据库的方法,其特征在于,所述方法还包括:在使用预设程序创建所述内存计算框架和所述图形数据库的连接之前,安装并启动所述图形数据库,并获取连接所述图形数据库所需的用户名、密码以及图形数据库地址。
7.根据权利要求1所述的批量数据导入图像数据库的方法,其特征在于,所述parquet边文件中每一条数据对应开始start节点和结束end节点;
所述将要导入到图形数据库的批量数据变换为预设格式的文件包括:对于所述节点数据,判断节点是否存在,如果节点存在,则对该节点数据属性进行更新;如果节点不存在,则新增该节点的节点数据;对于所述边数据,判断需要建立边的start节点和end节点是否存在,如果所述start节点和end节点都存在,则建立新的边关系,如果start节点和end节点有一个或一个以上不存在,则不建立新的边关系。
8.根据权利要求1-7任意一项所述的批量数据导入图像数据库的方法,其特征在于,所述图像数据库包括:noe4j图形数据库。
9.根据权利要求8所述的批量数据导入图像数据库的方法,其特征在于,所述通过所述连接将所述预设格式的文件导入所述图形数据库包括:通过批量执行所述noe4j图形数据库的cypher语句进行所述预设格式的文件的导入。
10.一种批量数据导入图像数据库的装置,其特征在于,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1-9任意一项所述的批量数据导入图像数据库的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910606480.9/1.html,转载请声明来源钻瓜专利网。