[发明专利]基于大数据的集群数据同步方法、装置、设备及存储介质在审
申请号: | 201910873512.1 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110795499A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 饶刚 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/22;G06F16/23;G06F16/182;G06F16/178 |
代理公司: | 44385 深圳市世联合知识产权代理有限公司 | 代理人: | 刘畅 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同步数据 集群 任务监控 数据同步 数据转换 指令 数据处理技术 并行通信线 并行线程 存储结构 存储介质 接收数据 任务状态 实时跟踪 实时记录 数据丢失 数据实现 数据状态 同步状态 同一系统 大数据 同步的 转换 匹配 架构 反馈 响应 申请 | ||
1.一种基于大数据的集群数据同步方法,其特征在于,包括:
接收数据导入指令,所述数据导入指令用于将第一集群中的待同步数据同步至第二集群;
响应于所述数据导入指令,获取所述第一集群中的待同步数据,对所述待同步数据执行数据转换,以将所述待同步数据转换为匹配所述第二集群中存储结构的待同步数据;
建立多条并行通信线程和任务监控表,基于所述多条并行通信线程将转换后的所述待同步数据同步至所述第二集群中,并基于所述任务监控表实时记录数据的同步状态。
2.根据权利要求1所述的基于大数据的集群数据同步方法,其特征在于,所述接收数据导入指令的步骤之后,所述方法还包括步骤:
判断所述数据导入指令是否为第一次从所述第一集群中将数据同步至所述第二集群;
若是,将所述第一集群中的全量数据作为所述待同步数据;
若否,则将所述第一集群中的增量数据作为所述待同步数据。
3.根据权利要求2所述的基于大数据的集群数据同步方法,其特征在于,所述判断所述数据导入指令是否为第一次从所述第一集群中将数据同步至所述第二集群的步骤还包括:
获取所述数据导入指令中的时间戳,根据所述时间戳判断所述数据导入指令是否为第一次从所述第一集群中将数据同步至所述第二集群;
当确认所述数据导入指令非第一次从所述第一集群中将数据同步至所述第二集群时,检测所述时间戳之前的所述第一集群中的数据是否有更新;
若有更新,将所述更新的数据与所述时间戳之后的新增数据共同记为所述增量数据。
4.根据权利要求1所述的基于大数据的集群数据同步方法,其特征在于,所述获取所述第一集群中的待同步数据的步骤之后,所述方法还包括步骤:
在所述第一集群中对所述待同步数据执行数据分区,以将所述待同步数据存储在通过数据分区划分出的多个分区中。
5.根据权利要求1所述的基于大数据的集群数据同步方法,其特征在于,所述对所述待同步数据执行数据转换的步骤包括:
获取所述第二集群中数据记录表的行键和列簇,基于所述行键和列簇的存储结构重建所述第一集群中的待同步数据。
6.根据权利要求5所述的基于大数据的集群数据同步方法,其特征在于,所述对所述待同步数据执行数据转换,以将所述待同步数据转换为匹配所述第二集群中存储结构的待同步数据的步骤之后,所述方法还包括步骤:
在所述第二集群中配置若干个空的预分区,基于获取的所述行键为每个预分区分别设置起始键值和终止键值,使所述行健的值均位于所述若干个空的预分区的最小起始键值与最大终止键值之间。
7.根据权利要求6所述的基于大数据的集群数据同步方法,其特征在于,所述对所述待同步数据执行数据转换的步骤还包括:
获取用户ID,通过MD5消息摘要算法对所述待同步数据执行散列处理生成MD5散列值,并截取所述MD5散列值的后n位数值与用户ID进行拼接以生成所述待同步数据的行键。
8.一种基于大数据的集群数据同步装置,其特征在于,包括:
指令接收模块,用于接收数据导入指令,所述数据导入指令用于将第一集群中的待同步数据同步至第二集群;
数据转换模块,用于响应于所述数据导入指令,获取所述第一集群中的待同步数据,对所述待同步数据执行数据转换,以将所述待同步数据转换为匹配所述第二集群中存储结构的待同步数据;
同步执行模块,用于建立多条并行通信线程和任务监控表,基于所述多条并行通信线程将转换后的所述待同步数据同步至所述第二集群中,并基于所述任务监控表实时记录数据的同步状态。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任意一项所述的基于大数据的集群数据同步方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任意一项所述的基于大数据的集群数据同步方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910873512.1/1.html,转载请声明来源钻瓜专利网。