[发明专利]图数据库的增量更新方法、系统、介质和电子设备在审
申请号: | 202111438548.0 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114116751A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 李琪;胡逸天;黄珊珊 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23 |
代理公司: | 上海汉之律师事务所 31378 | 代理人: | 周婷婷 |
地址: | 518066 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 增量 更新 方法 系统 介质 电子设备 | ||
本发明涉及人工智能技术,提出一种图数据库的增量更新方法、系统、介质和电子设备,方法包括:获取至少前后两期的全量数据;生成节点增量差异表和关系增量差异表;将节点增量差异表和关系增量差异表转换成字符分割值文件,并保存在文件服务器中;通过所述文件服务器与图数据库进行数据交互,将字符分割值文件传入所述图数据库,完成图数据库的增量更新。本发明采用的是基于增量差异表的增量更新方式,而非全量更新,有效缩短了数据更新时间,提升了客户满意度;同时,不同于全量更新时的停库,增量更新是小批量的更新,更新期间客户也可以正常访问图数据库,让用户对图数据库的变动无感知,优化了用户的体验感。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种图数据库的增量更新方法、系统、介质和电子设备。
背景技术
在数据分析领域,描述性数据分析(依赖数据本身的语义描述实现数据分析)越来越受到重视,而图数据库正是面向复杂关系数据建模的重要工作。图数据库作为一种新型的数据建模载体,伴随着人工智能和大数据的浪潮,正在广泛地往各行各业渗透,Neo4j是图数据领域最成功的商业案例。
但是,图数据库不同于传统的关系型数据库,可以分表分库,目前,图数据库的更新大都采用的是全量更新的方式,即先导成字符分割值文件(CSV文件),然后停库,从后台服务器导入,待导入完成后,再启动服务器。这种更新方案在亿级工商数据的背景下,有些许不足。首先、数据更新慢,工商数据更新频繁,而图数据库的全量同步长达10小时以上,会影响一些实时的业务流程。其次,全量更新在停库时,用户无法访问。
因此,目前急需一种数据更新快且不影响访问的图数据库更新方案。
发明内容
鉴于以上现有技术存在的问题,本发明提供一种图数据库的增量更新方案,用于解决据上述技术问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种图数据库的增量更新方法,包括:
获取至少前后两期的全量数据,所述全量数据至少包括全量节点和全量关系;
比较前后两期的所述全量节点,生成节点增量差异表;比较前后两期的所述全量关系,生成关系增量差异表;
将所述节点增量差异表转换成第一字符分割值文件,将所述关系增量差异表转换成第二字符分割值文件,并将所述第一字符分割值文件和所述第二字符分割值文件保存在文件服务器中;
通过所述文件服务器与图数据库进行数据交互,将所述第一字符分割值文件和所述第二字符分割值文件传入所述图数据库,完成所述图数据库的增量更新。
可选地,在获取所述全量数据时,针对每个所述节点,根据所述节点的数据属性生成节点属性值编码,所述节点属性值编码包括所述节点的识别编码;或者,在获取所述全量数据时,针对每个所述关系,根据所述关系的数据属性生成关系属性值编码,所述关系属性值编码包括所述关系的识别编码,所述关系的识别编码至少包括头节点的识别编码、尾节点的识别编码及关系类型。
可选地,所述比较前后两期的所述全量节点,生成节点增量差异表;比较前后两期的所述全量关系,生成关系增量差异表包括:
根据所述节点的识别编码和节点属性值编码,比较前后两期的所述全量节点,判断每个所述节点的更新状态;
根据各个所述节点的更新状态,更新所述节点增量差异表;
根据所述关系的识别编码和关系属性值编码,比较前后两期的所述全量关系,判断每个所述关系的更新状态;
根据各个所述关系的更新状态,更新所述关系增量差异表。
可选地,所述节点的更新状态包括新增、删除和修改,所述根据各个所述节点的更新状态,更新所述节点增量差异表包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111438548.0/2.html,转载请声明来源钻瓜专利网。